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Falling-Rising Intonation Patterns in English 


By ALAN E. SHARP, London 


Recent contributors to English Studies have drawn attention to 
a problem of English intonation which has long been in need of 
clarification. Dr. W. R. Lee+ and Dr. Maria Schubiger® have given us 
their views on what they consider to be the various kinds of ‘fall-rise 
intonations’ in English. Dr. Lee expresses the hope that his contri- 
bution, which he modestly describes as ‘tentative and marginal 
only’, may help to stimulate observation and discussion. Since I have 
myself long found the lack of clarity in this field particularly vexa- 
tious, I welcome this opportunity to give some semblance of order to 
my ideas and to present them here for criticism. 

The purpose of this paper is twofold: to try to resolve some of 
the confusion surrounding this particular chapter of English in- 
tonation; and, incidentally, to examine some of the implications of 
my Own interpretation for the writing of continuous texts. If justifi- 
cation is needed for the amalgamation of these two aspects of the 
problem, it is to be found in my experience that deficiencies of 
analysis have, not unnaturally, had unfortunate repercussions on 
the presentation of practical material. The unacceptable treatment 
of the problem here examined has been for me easily the greatest 
single cause of dissatisfaction not only with existing descriptions of 
English intonation, but also with much of the reading material so 
far published, whether accompanied or not by such descriptions. 
Inasmuch as the search for greater consistency in the writing of 
continuous texts, however short, may stimulate more careful obser- 


1 Fall-Rise Intonations in English. 
2 Again: Fall-Rise Intonations in English. 
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vation, it is my hope that theory and practice may interact in this 
field to their common advantage. 

It must be emphasized at the outset that attention is here 
focussed on one small corner only of the field of English intonation, 
without prejudice or deference to the requirements either of other 
similarly restricted studies or of any thoroughgoing analysis of the 
whole subject. In view of the long history of confusion in the matter 
before us, it is felt in this instance to be of greater urgency to try to 
reduce this confusion in some measure than to concentrate on giving 
a wider analysis on the assumption, which in this respect at least is 
obviously unwarranted, that the data which would form the basis 
of such an analysis are common property. In the interest of the 
greatest possible lucidity, the discussion will as far as is feasible be 
narrowed down to the hard core of the problem, and in particular 
the following restrictions will apply: 


(i) The falling-rising intonation patterns considered are ‘final’ in 
the sentence, in that they are not followed by other so-called 
‘kinetic tones’. 

(ii) Except where otherwise stated, the type of speech in question is 
‘unemphatic’ and ‘unemotional’. 


In the course of the exposition of the central problem, certain 
ancillary topics, in themselves both interesting and important, will 
of necessity be introduced. The discussion of these will be regarded as 
secondary for our present purpose, and though some at least of them 
will, it is hoped, be given fuller treatment on another occasion, they 
will here be strictly subordinated to the main issue. 

Some of the special difficulties of the subject are typified by the 
twin facts that Lee, having stated that ‘several types of fall-rise are 
formally distinguishable’, goes on to agree with Schubiger’s earlier 
statement that it is sometimes hard to distinguish two of them; and 
that Schubiger herself, in her reply to Lee’s article, whilst distinguish- 
ing four types of ‘fall-rise’, can state that Type 3 is often identical in 
form with 1 and 2. We may summarize the problem before us as 
being that of deciding how many types of falling-rising intonation 
we may usefully recognize and what their differentiae are. 

The problem becomes more meaningful to those who believe in 
polysystemic analysis when the question is posed separately for each 
major sentence-type in turn. That is to say, we shall do better to ask 
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in the first place how many types of falling-rising intonation may 
usefully be recognized as applied to, say, statements; then as applied 
to ‘special’ or ‘general’ questions; and so on. We may well find that 
the results are similar over a wide range of sentence-types: even then 
we shall not necessarily equate the similar patterns, especially if 
they are found to be terms in incongruent commutation systems. 
The guiding spirit of polysystemic analysis, however, is not so 
much a desire for complexity for its own sake as a dislike of in- 
accurate oversimplification and specious simplicity. We need feel no 
disappointment, therefore, if we find that particular intonation 
patterns are very widely distributed. In any event, for the purposes of 
textual transcription it may well be found appropriate to use a 
monosystemic approach. Since, however, it is in any case obviously 
desirable to remove all inessential sources of possible confusion, we 
shall concentrate initially on statements. 

We may with advantage further restrict the discussion by 
straightway excluding Lee’s Type 3 — his ‘fall-rise TUNE’. This 
pattern, which, as Schubiger has pointed out, is merely one form of 
what is best known as “Tune II’, is seldom confused (though see 
below) with the type of pattern that is the subject of this paper, 
namely where the fall takes place, or at least begins, within the 
stressed syllable, hereafter referred to as the ‘focal syllable’, on which 
the falling-rising pattern is effectively ‘initiated’ — that is, if we ignore 
as irrelevant any syllables preceding the fall. Schubiger’s Type 4 she 
herself characterizes as non-final, and we may therefore exclude this 
also in accordance with restriction (i) above. We are thus left, as far 
as the current discussion goes, with Lee’s Types | and 2, and Schubiger’s 
Types 1, 2 and 3. We shall in fact be essentially concerned in this 
paper with a distinction of the type made by Lee between his Type 1, 
which he calls ‘the fall-rise TONE’, and his Type 2, which he calls 
‘the fall-rise SEQUENCE’. I agree at least to the point of wishing to 
distinguish a unitary pattern from a binary one. The unitary pattern 
I shall here refer to as FR ( = ‘fall-rise’, which term I prefer to restrict 
to this application), the binary as F + R (= ‘fall-plus-rise’ or ‘fall- 
followed-by-rise’). 

It is assumed that readers are familiar with the general outline 
of the falling-rising pattern or patterns, and in particular with the 
fact that such a pattern may be initiated (in the sense given above) 
at any point ina sentence up to and including the last syllable. Where 
the pattern is initiated (and necessarily terminated) on a final, 
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perhaps solitary, monosyllable, there is no difficulty of interpreta- 
tion; and this remains in general true where the ‘focus’ of the pattern 
is any syllable of a final polysyllabic word. In these cases we are by 
general consent dealing with the unitary (even if ‘spread-over’) 
pattern, and those who extend their use of the notation /"/ or its 
equivalents to non-final syllables here use this notation consistently. 
Once, however, even a single word follows the ‘focal’ word and is 
orthographically separated from it by a space, the pattern is va- 
riously described and/or indicated. This in itself is unexceptionable 
(nay, in my view highly desirable), but it is here that I maintain that 
inconsistency is to be found. I suggest, in effect, that not infrequently 
where the description or notation states or implies that we have FR, 
we have in fact F + R, and vice versa. It is this contention that | am 
concerned to justify in this paper. 

In the type of sentence under discussion we have equally rea- 
sonable grounds for postulating either FR or F + R. Considerations 
of patterning and the like allow no priority of interpretation to 
either. The ‘occurrence’ of F +R is to be expected in view of the 
unambiguous occurrence on a single ‘substrate’ (as I shall call what 
‘remains’ of the sentence-form when the intonation pattern has been 
abstracted) of F+ F, R+F, F + FR, etcetera, some at least of which 
must be analysed as sequences rather than as unitary patterns since 
they are not found on a monosyllabic structure: whilst the ‘spread- 
over’ of FR is already observable in the case of the plurisyllabic 
one-word sentence, and the existence of pluriverbal ‘tails’ — that is, 
the incidence of the last major prominence (see below) on a non-final 
word — is attested for F and for R equally. 

It is obvious that no question of there being confusion or hesi- 
tation between FR and F+R would have arisen if there were a 
really clear-cut phonetic difference between the exponents of the 
two patterns. One must conclude that outside the small area of 
universal agreement referred to above the phonic data in themselves 
supply either no criteria whatever for setting up two distinct patterns 
or only such differentiae as are difficult to appreciate. In my own 
view, we are dealing with the second case; that is, FR and F+R 
have very similar exponents. 

We may consider the differences between the two patterns under 
two heads: a) rhythm b) pitch. In both connexions it is important 
to iterate that we are discussing ‘unemphatic, unemotional state- 
ments’. The examples given in this part of the paper will probably 
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be better appreciated at a second reading after what will be said 
later about the meanings of the two patterns. 

In both types of falling-rising pattern the focal syllable may be 
said to have major prominence. This term must remain undefined here, 
but should not be exclusively associated with ‘kinetic tones’. F +R, 
however, in contrast to FR, is essentially compound, and requires 
a further major prominence after that of the focal syllable. This 
necessitates at least one full rhythmical juncture at some point after 
the fall. The focal syllable cannot, therefore, be followed only by 
elements that combine with it into a single rhythmical unit. For 
example, what may be termed the ‘enclitic’ exponents of the object 
pronouns appear to unite in this way with a preceding verbal 
element. Such a sequence — one type has been called a ‘phonemic 
word’ * — cannot constitute the sole effective substrate for F+R. 
Thus though we can say /ai v ‘si:n ‘him/, we cannot, except in 
illiterate speech, say /ai v ‘si:n ‘im/: whereas we can say /ai v “si:n 
im/. This is comparatively straightforward: the difficulty evident- 
ly begins when once we leave behind the stereotyped list of 
recognized “weak forms’. Even in the case of the pronouns, no 
‘weak form’ is recognized for ‘it’. In point of fact, however, the 
strong form is rare in my speech, being very often replaced by 
‘that’. That is to say, though I can quite happily say /ai v “si:n 
it/, I should in most contexts tend to say /ai v ‘si:n “Oet/ rather 
than /ai v ‘si:n ‘it/, whereas the latter would be frequent and 
normal in the speech of my wife, who is Scots. Again, in my own 
speech the form /ju:/, for instance, does not occur unstressed in 
sentence-final position, so that I say /ai v “si:n ju/, not /ai v “si:n 
ju:/. The latter form, as used by many London speakers, rings oddly 
in my ears since I tend to associate final /ju:/ with the prominence 
found, for instance, in /ai v ‘si:n ju:/. This type of difference would 
be perhaps most clearly appreciated in examples taken from a dialect 
in which the ‘strong’ and ‘weak’ forms of the pronouns were more 
markedly different than is the case with some of the standard forms. 
We may compare, for instance, Devonian /ai v “sin on/ (=standard 
jai v “sitn im/) with /ai v ‘sin ‘i:/ (=standard /ai v ‘si:n “him/). 

The difficulty is further aggravated when we move from pro- 
nouns, which as a class are acknowledged to have ‘weak forms’, to, 
say, nouns, which in general are not. The occurrence of rhythmically 


8 Trager and Smith, § 1. 73. 
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weak forms of, e.g., ‘John’ is not sufficiently recognized. This is 
because of the comfortable permanence of the transcriptional sym- 
bolization of such words combined with the practice of grammatical 
spacing, the phonetic validity of which tends to be questioned only 
when we have, as it were, already been jolted out of our complacency 
by the occurrence of a recognizable ‘weak form’. It tends to be 
assumed, in fact, that nouns will be stressed. Hence, I do not doubt, 
much of the confusion between /ai v “si:n d3on/ and /ai v ‘si:n“d3on/. 
In fact, however, there is a rhythmical relationship between these 
two comparable with, but less easily appreciated than, that between 
jai v ‘si:m im/ and /ai v ‘si:n “him/. 

The presence of a second major prominence, though a prere- 
quisite for the occurrence of F + R, does not, unfortunately, identify 
it. This is because it is possible to have such prominence wzthin the rise 
of FR. Thus, though /ai v “si:n ju:/ does not occur in my speech, 
what I shall write as /ai v “si:n ,ju:/ does. This has the same rhyth- 
mical pattern as /ai v ‘si:n jju:/. In order to make these distinctions 
more credible, I cannot avoid some passing reference to a subject 
which will require full treatment of its own elsewhere — prominence 
in so-called intonation ‘tails’. We find not only /ai v ‘si:n im/ but 
also /ai v ‘si:n ,him/, where /,/ is used to denote major prominence 
on a (in the context of | | only) low level pitch. This structure, which 
I shall call F+ L, has the same rhythmical pattern as F+ R, as in 
Jai v ‘sizn “him/, and is subject to the same restrictions, etcetera. 
I can, for instance, say /ai v ‘si:n ,ju:/, though not /ai v ‘si:n ju:/: 
but for /ai v “si:n ,it/ (normal for my wife) I usually say /ai v “si:n 
\Oet/ (or /ai v ‘si:n det/). Whereas, however, we have /ai v ‘si:nim/ 
corresponding to /ai v ‘si:n im/, we have apparently only one 
pattern, which might be written either /ai v “si:n ,him/ or /ai v “si:n 
‘him/, to set against /ai v ‘si:n ,him/ and /ai v ‘si:n ‘him/. In other 
words, the tonal commutation system after /” /, which it is no part 
of this paper to describe in detail, is apparently not congruent with 
that after /"/. The ‘indeterminate’ structure in question I shall call 
FR +L, using the notation /~,/, to point the parallelism with F + L, 
since in both cases the second prominence may be regarded as not 
disturbing the outline of the intonation contour already established. 

How, then, are we to distinguish F + R from FR +L, since they 
have the same rhythmical pattern and are both falling-rising? For 
the answer, insofar as there is an answer, we must turn to con- 
siderations of pitch. I am conscious in this matter of the danger of 
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failing to get rid of that ‘personal equation’ against which we are 
warned by Sweet*. Chastened by this warning, although I am fairly 
certain that what I am about to describe is not just a characteristic 
of my personal idiolect, I shall for the moment confine myself to 
saying that in my own speech at least there is a distinct tendency for 
F + R to fall to a lower pitch, and finish on a lower pitch, than FR. 
In terms of tonic sol-fa notation a typical comparison might be 
between m s d for F + R and m Ir for FR, and the difference may 
be greater than this. If the ‘register’ of the second half is compara- 
tively low, I get a distinct impression of F +R: if comparatively 
high, of FR. I do not pretend, however, that there is a really clear-cut 
difference of this kind. There seem to be many utterances which fall 
into an area of indeterminacy where considerations of pitch would 
allow either interpretation. 

Thus far attention has been directed to FR and F + R as applied 
to very brief substrates only. This restriction has been observed 
advisedly, since the detailed consideration of long substrates would 
involve us too deeply in those questions of prominence which, as I 
have already said, merit a separate paper. It may, however, be said 
here that in addition to the typically higher register, longer FR 
sentences have, as Lee says, a tendency to start rising immediately 
after the fall, though it cannot be denied that the pitch often remains 
low level over a number of syllables. In the case of F + R, however, 
in addition to the ‘lower’ tendency in general, any syllables inter- 
vening between the F and R focal syllables regularly remain low, 
thus /ower than the low syllables of FR. 

In order to obtain, if possible, a somewhat less subjective im- 
pression of the difference between the two patterns, I recorded with 
as little exaggeration as possible fifty sentences, some with FR and 
some with F +R. I later played back the recording to see how far I 
could distinguish what I had recorded. In the case of approximately 
two thirds of the examples I received a distinct impression one way 
or the other: in the remaining cases I did not feel sufficiently certain 
to write anything down. Reference to the text of the recording 
showed that where I had hazarded a guess I had invariably drawn 
the right conclusion. 

Now it is quite obvious that a speech community could not 
function as such if, in general, a speaker did not supply his listeners 


4 Sweet, Preface, VIII. 
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with sufficient clues to act upon, whatever the nature of the response, 
if any, desired. Indeed, so apparently lavish is the supply in some 
cases that it has been considered worthwhile to calculate the degree 
of ‘redundancy’ in various languages. Over considerable stretches of 
speech, then, ambiguity is unlikely to arise. It is recognized, however, 
that where syntactical criteria are used to establish elements of 
linguistic structure, such criteria are, by their very nature, not 
necessarily available to identify the exponents of those elements in 
any given utterance, so that homophony cannot invariably be re- 
solved. It is nevertheless all too widely assumed, in my view, that 
the exponents of given elements of structure either regularly are, or 
regularly are not, homophonous (in a given context). 

Whatever may be the phonological factors into which we 
analyse the totality of speech, we can set up commutation systems 
of one sort or another to account for the phenomena we observe. In 
the case of many very simple structures, such as the one-word sen- 
tence, we have normally little difficulty in counting the terms of 
those systems or in identifying their exponents. In the case of longer 
and more complex structures, however, and even in that of some 
that are comparatively simple, it is difficult to decide with any 
certainty whether or not we are dealing with homophony. It seems 
to me little more than a subterfuge to pretend that this is a question 
of style, as with, for instance, Hockett’s antithesis of ‘clarity norm’ 
and ‘frequency norm’ >, unless we set up an unusually artificial style 
from which all phonological ambiguity is by definition excluded. 
Just as there are cases where the hearer is, so to speak, overwhelmed 
with multiple clues, so there are cases where despite careful speech 
and careful listening the available clues prove inadequate. Where 
failure to distinguish exceeds what is attributable to occasional 
inadvertence, yet some utterances are unhesitatingly and correctly 
assigned to one or other rival interpretation, we are in the realm 
of what may be called (since the term ‘overlapping’ has been used 
in another sense) ‘shading’ exponents. 

Many possible cases of such shading suggest themselves in addi- 
tion to the one before us. There is a whole twilight world here, all 
too familiar to the punster. I may perhaps refer to the experiment in 
stress perception made by WN. C. Scott® which showed that /'impo:ts/ 
and /im'po: ts/ were distinguished only with difficulty on a low level 


5 Hockett, p. 220. 
6 Scott, p. 44. 
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pitch. A more satisfactory example from my own speech would be 
the unusual type of distinction operating within a single grammatical 
category between /'lukaut/ (man on watch) and /luk'aut/ (prospect) 
as in “That’s your own look-out” said with falling pitch on ‘own’ and 
low level pitch on ‘look-out’. 

This type of partial indeterminacy need cause the linguist no 
serious embarrassment except in the early stages of trying to devise 
a minimum graphetic vocabulary. Once it has been determined by 
some rigorous technique what utterances are definitely not descripti- 
vely equivalent, and such a minimum vocabulary has been chosen 
to cover all such cases, there will comparatively seldom be hesitation 
even in recording an individual utterance, since we are in no small 
measure conditioned in our listening by considerations of expect- 
ancy. In any case, where we are concerned, as in transcription from 
orthography or in the provision of reading material, with supplying 
the means for adequate renewal of connexion not with some indi- 
vidual utterance but with a whole class of descriptively equivalent 
utterances, we shall have fulfilled that requirement once we have 
stated the structure of that utterance-form together with all necessary 
reading conventions: but these conventions shall include, if it is 
desired that repeated renewals of connexion shall simulate the va- 
riety of the original data, a statement of the permissible degree of 
overlap, if any, of the exponents of such diversely symbolized ele- 
ments as the structure may contain. This amounts in practice to 
saying that where two utterance-forms are distinguishable by ear 
only part of the time, they may nevertheless be consistently distin- 
guished in transcription. 

This assumes, however, the ability to ‘recognize’ the utterance- 
form itself: and in a field so ill-charted as intonation it is perhaps not 
surprising that this ability is often suspect. In an attempt, therefore, 
to reduce such indecision as may apply to the type of material 
considered in this paper, an appeal will now be made to those 
features of a wider context that have been variously taken to consti- 
tute ‘meaning’ of one sort or another. 

Such an appeal does not necessarily entail the abandonment of 
further formal analysis and an immediate recourse to vague notional 
criteria. Insofar as it is possible to make any clear-cut dichotomy 
between the intra-linguistic and extra-linguistic components of 
meaning, it is a widely accepted principle of modern linguistics that 
reference to the former shall have priority over reference to the latter. 
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This means for our purpose that the ultimate justification for stating 
that two intonation patterns differ in meaning will preferably lie in 
the demonstration by a technique of ‘longer piece’ analysis that the 
sentences which they respectively characterize stand in different 
formal relationships to surrounding speech events; and the statement 
of their meanings will consist precisely of the description of those 
relationships. This would be in part no more than a kind of into- 
national syntax, but would also involve, for instance, reference to 
the repetition or non-repetition of particular lexical items. If it ever 
becomes possible adequately to categorize the non-verbal behaviour 
associated with speech, further, quasi-formal, correlations may 
eventually be established. Meanwhile, long acquaintance with such 
recurrent patterns of verbal and non-verbal behaviour makes, or 
should make, a sensitive native speaker intuitively aware of the broad 
syntactical, collocational and situational potentialities of a given 
utterance-form. In the present unsatisfactory situation it would be 
doctrinaire to refuse to make use of such resources. As a shorthand 
substitute for the type of description ultimately desirable it has been 
found useful in the past to make use of intralingual translation 
and/or brief indication of actual or potential verbal contexts, and in 
what follows I shall not hesitate to make use of this method where 
convenient. 

At this point, then, I shall assume that a formal distinction has 
been established between FR and F + R, and shall pass on to consider 
what generalized meanings if any may be said to characterize the 
two patterns. Failure to observe a regular distinction between FR 
and F + R has led to confusion of the meanings properly belonging 
to the separate patterns and consequent inability to perceive such 
consistency as is observable in their use. Even now we shall not 
necessarily have eliminated the problem of homophony, since even 
if we concede the distinction between FR and F+R, we may still 
feel it necessary to say that we have more than one FR and/or more 
than one F + R if the meanings covered by either appear to cover too 
wide a range or be wholly ‘discontinuous’. Nevertheless it should 
now be possible to subdivide the meanings found for all falling- 
rising sentences into two sections in such a way that any given 
meaning falls unambiguously into one or other section. The division 
will be made on the basis of the formal characteristics outlined above. 
Though in listening to any given utterance we may not apprehend 
the special characteristics of either pattern, we shall yet find them 
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over a large enough sampling of such utterances; and having once 
found them and allotted the meaning accordingly we shall be able 
to allot any ambiguous utterance we hear to one or other pattern by 
using the meaning as a clue. If we ourselves are writing texts for 
others to read, we must choose accordingly, since to anyone who 
associates different meanings with the two patterns the indication 
of the wrong pattern will make as little sense as if he were asked to 
read “Drink up your bier’. 

The term ‘contrastive’ might with reason by applied to any 
element of speech inasmuch as its very occurrence in an utterance 
contrasts with the occurence of any other element that might have 
filled the same place in structure. Consequently any sentence might 
be held to indicate at least as many contrasts as it contained elements 
of structure. Nevertheless, those elements in a sentence which may 
be considered to be in any respect more prominent than their 
neighbours, though they are not in consequence any more contrastive 
than those neighbours, may perhaps be held to be singled out for 
special mention and a highlighting of such contrasts. Falling-rising 
intonation patterns have very generally been credited with favouring 
such highlighting to a particularly high degree — with being, so to 
speak, the contrastive intonation par excellence. I feel that in the 
case of FR this view is not very wide of the mark. Certainly one very 
common meaning of FR may be described as contrast of the ‘this, 
not that’, ‘this, but not that’ or ‘this, even if not that’ variety. Thus, 
for example, “I’ve “seen him” (but I’ve never heard him speak) ; 
“Friday” (not Thursday, as you have just incorrectly stated) ; 
““He’s “clever’’ (even if we don’t like him). The contrast, it should be 
noted, need not be felt to apply only to the word containing the focal 
syllable. Thus ‘‘I’ve peeled the po‘tatoes” may as often suggest “but 
I’ve not made the beds”’ as “‘but P’ve not peeled the apples”’. 

The kind of demonstration that would help to put this meaning 
of contrast on a more acceptable formal basis would be to show that 
FR frequently occurred followed by ‘but’, ‘although’, ‘even if’, and 
so on, or in contexts where the next clause was a repetition of the 
first apart from some one word or phrase and the presence or absence 
of negation, as in Palmer’s example, quoted by Lee, “‘I didn’t say it 
was “white, I said it was ‘black’. It is hoped that this paper may 
prove to be an earnest of such research. 

The general meaning of ‘contrast’ may probably be stretched 
to embrace most of the occurrences of FR. Even Lee’s “Sir!” (if we 
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may temporarily go outside the field of statements), in which he 
says there is nothing contrastive, might be said to have a flavour 
of “It’s you, not someone else, that I’m calling”. 

It is less easy to give a concise label to the meaning of F+R. 
Schubiger is perfectly right when she speaks of the rise after the fall 
as giving a certain amount of prominence to the word on which it 
falls. This might, unfortunately, be said of any stressed syllable. 
Elsewhere’ Schubiger states that “‘there is a connection between the 
pattern of English intonation and the established word-order. It is 
the scheme of intonation that has brought about in the past the 
present English word-order so far as it is fixed, and it is this same 
scheme of intonation that influences word-order today in those cases 
where it is still free.”” Whether we can assert this priority of causation 
is open to question, but we may willingly accept that word-order 
and intonation are in some way connected. The examples most 
frequently given for F +R are those where the rising element is 
relatively independent and may with much the same effect be found 
before the falling element or separated from it by a pause. This is 
particularly the case for adverbial words, phrases or clauses. Where, 
on the other hand, the order of the elements of the substrate is 
relatively fixed, F + R is not recognized with anything approaching 
the same consistency. Yet F +R occurs with substrates of many 
different kinds, and the independence of the rising element from the 
point of view of word-order is variable. One important example 
must suffice. In sentences containing (to use the traditional terminol- 
ogy) subject, verb and object it is unusual, though not impossible, 
for the object to stand first. Thus “‘John I’ve seen” and “London I 
dislike” occur much less frequently than “I’ve seen John” and “I 
dislike London’’: whereas, for instance, ““Sometimes I walk’ and 
“Unfortunately, he drinks” compare much more favourably with 
“T walk sometimes” and “He drinks, unfortunately”’. 

Now with the simple falling pattern (“Tune I’ of Armstrong and 
Ward) the fall may take place at any point of the substrate in accor- 
dance with the requirements of the situation or of idiom, and this 
may leave any number of words after the fall on a low level pitch. 
In general these words will be at least partially “anaphoric” in 
effect, and might in some cases be omitted without much loss. In 
many cases, however, the words after the fall are not so ‘superfluous’, 


? Schubiger, 1935, p. 11. 
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and require a degree of highlighting which cannot be attained on a 
low level pitch, and which for certain substrates may be ‘brought 
about’® by front-shifting of the final element. Where this front- 
shifting is not possible, or even where it is, the highlighting may 
‘alternatively’ be brought about by a rise on the final element in 
question. It must be clearly understood that I do not say that the 
two word-orders are identical in meaning. From one point of view 
the very fact that there may be the two possibilities might itself be 
taken to establish two different meanings. My use, therefore, of “with 
much the same effect” and “alternatively” must be taken to imply 
nothing more than a close similarity of meaning. Now the relation- 
ship of F + FR to FR + F is probably more readily appreciated than 
that of F + R to R + F, and it may be helpful to set up the following 
equation: 


F+FR:FR+F::F+R:R+F 
Oryalv sl arazomis: | dzon ai sion): 
faiv si:n “dzon/ : /“dzon ai v ‘si:n/ 


I should not like to press this equation unduly at the moment, and 
I do not wish to lay myself open to a charge of ignotum per ignotius. 
I may, however, point out here that front-shifting of this kind with 
F + R achieves the same result as Schubiger’s ‘stopping in the middle’ : 
that is, we find out whether in the new circumstances the focal 
syllable has a fall only or a fall-rise. I have myself long recommended 
these tests to students, though I fear that their utility may be very 
limited, since it may well be that they can be correctly carried out 
only by those who already appreciate the distinction and have in 
consequence no need of them. It may nonetheless be worthwhile to 
add that an expansion of the front-shifted element may prove helpful 
to some. This expansion may often be given the form ‘‘Where’... 
is/are concerned,...”. Thus “I'like ‘John’ may be referred to 
“Where ‘John is concerned, I “like”. Other quasi-expansions might 
be ‘“‘My feeling towards ‘John is one of ‘liking”’ or, if the original, 
rather than the front-shifted order is preferred, “‘It is liking that I 
feel towards ‘John’. 

In common with simple F, F+R may sometimes suggest the 
addition to the substrate of such words as ‘even’, ‘also’ or ‘for 
example’. In such cases the element pinpointed by the fall is asso- 


8 The use of the expressions “brought about” and “‘front-shifting”’ is for convenience 
of statement only, and must not be taken to imply the primacy of either word-order. 
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ciated in some way with other such elements. This is in sharp contrast 
to the often strongly dissociative effect of FR. We may compare 
[that’s not ‘bad/ (something else was quite good: this too is very 
fair) with /“that’s not bad/ (though the others were poor: or, we take 
no responsibility for the others). 

What has been said about word-order, front-shifting and the like 
may perhaps help to make acceptable the last, and in many ways 
the most important, point that I should like to make about F+R. 
It is sometimes said that falling tunes have finality, whereas rising 
tunes are suspensive. The validity of these statements will neither be 
upheld nor be challenged. What I should like to emphasize is that 
F + R has every bit as much finality as any simple F sentence, and 
nothing of any suspense that may be found in simple R sentences. 
In other words, there is no ‘implication’. If F + R must be associated 
with Tune I or Tune IJ and if the generalizations about these patterns 
just referred to have any value whatever, then it is emphatically 
with the former that it has the greater affinity. 

Further exemplification of the two patterns, together with ap- 
propriate comment, will, I hope, help to clarify the distinction that I 
have been trying to make. The sometimes compressed, sometimes 
more long-winded explanations in parentheses are themselves ex- 
emplificatory only, and must not be taken to exclude other possible 
meanings equally in contrast with any suggested for the other 
pattern. Here as elsewhere in this paper all stress and tone marks 
not immediately relevant have been kept to a minimum to avoid 
involvement in those questions of prominence to which reference 
has already been made. 

For ease of future reference, my own examples will from this 
point onwards be continuously numbered. In accordance with what 
was said earlier, the first examples will all be ‘statements’: those that 
follow will be grouped into sections corresponding to other broad 
categories of sentence-form. This grouping is naturally arbitrary: 
it is obvious that the sentences of English could be almost endlessly 
subdivided. The best method of subdivision can, however, be de- 
termined only on the completion of the detailed study which I hope 
may one day be undertaken. The rough labels given to the interim 
classification are, not, however, notionally based: they summarize 
formal marks of broad categories of sentence structure which need 
not be re-stated here. The circularity inherent for our purpose in 
the use of intonational criteria is necessarily avoided. 


o>) 
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Statements 


. I ‘thought ‘so (you have confirmed what I thought). 
. I “thought so [(i) but have since been proved wrong; 


(ii) but your words have made me doubtful]. 


. I “think so (but may be wrong). 


It is interesting to note that I “think ‘so is a most unlikely 
utterance, and would have to mean something like, ‘Such 
is the way my ratiocinatory processes operate”’. 


. He “wants to (but can’t). 


N.B. He ‘wants ‘to is impossible. 


. He ‘wants “two (so he can’t throw them all away). 
. He “wants two (but can’t afford them). 
. He ‘shot him’‘self [(i) his wife he poisoned; 


(ii) his own hobby was shooting]. 
Note that in case (ii) a comma would be usual in the 
orthography: but neither a pause nor the retention of the 
/h/ is necessary in the pronunciation. Similarly, ‘““That’s 
the idea, is it?” may be heard as /dets Oi ai dior “iz it/, 
that is, with the ‘intrusive’ /r/. 


. He “shot himself [(i) but did not die of the wound; 


(ii) yowre wrong in saying that he cut his 
wrists |. 


. Ican do ‘that (so there’s no need for you to boast). 
. "I can (you have just said that you can’t). 
. ‘I ‘can (unenthusiastic admission of ability in response to, for 


instance, ‘““Who plays bridge?’’). 


. ‘He’s a ‘plumber (ask him how to mend the tap). 
. “He’s a plumber (the other man isn’t). 

. He’s a ‘queer ‘chap (as chaps go, he’s queer). 

. He’s a “queer chap [(i) So look out!; 


(11) but really very nice]. 


. She gave me the ‘sweetest ‘smile. (Some sort of smile was, 


perhaps, to be expected: hers was exceptionally sweet.) Cf. She 
gave me the ‘sweetest ‘smile. (Her smile was indeed very sweet: 
but, more important, she might have scowled.) 


Both our description of the two patterns and our examples have 


so far related to a single type of sentence. A similar distinction may, 
however, usefully be made in the case of other sentence-types; that 
is, we can distinguish two falling-rising patterns the characteristics 
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of which are in general similar to those of FR and F +R as set 
up for statements. Since it is essentially the distinction (or distinc- 
tions) that we are concerned with in this paper, I shall keep the 
same labels in discussing the other sentence-types. Some of the 
latter, however, tend to involve emotional or emphatic utterance 
more frequently than statements, so that what has been said above 
in connexion with the pitch and rhythm characteristics of unemo- 
tional, unemphatic statements will in any case not apply with the 
same regularity here. The distinction itself, however, is no less 
important; and insofar as it is possible to abstract those features 
of pitch range, tempo, and so on that correlate with emotional or 
emphatic utterance, the essential relationship still seems to hold. 


Requests 


17. “Eat well (warning: or you'll soon be exhausted). 

18. “Eat ‘well (entreaty: there’s a good boy!). 

19. “Do’smoke (make yourself at home. I know you like smoking). 

20. “Do smoke (e.g. A to B: ‘Don’t “smoke. C to B: ‘Do smoke, ie. 
ignore A’s plea). 

21. “Be an’angel (please). 


Thus with this type of sentence it is F+R that gives the 
effect of entreaty. FR often implies warning, but may occa- 
sionally, as with FR elsewhere, be used in correction. 


Questions 


There seems to be something of a conspiracy of silence where 
the association of falling-rising patterns with questions is concerned. 
It is decidedly singular that Palmer, whose work on English intona- 
tion is not to be lightly dismissed, should have stated® that the 
fall-rise was never used for questions. Lee states!° that ‘questions 
cannot, seemingly, end with a fall-rise tone’; and Schubiger!! that 
‘the occasional fall-rise intonation of questions constitutes too subtle 
a problem to be treated in this short article’. It would seem, there- 
fore, that this is the most difficult part of our problem, and I must 
admit that I am not yet certain how far one might challenge 


® Palmer, p. 82. 
10 Lee, p. 70. 
11 Schubiger, 1956, p. 159, n. 7. 
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Schubiger’s use of ‘occasional’. That is to say, I am not yet prepared 
to say how often FR and F +R are used in questions: but that they 
are used is beyond doubt. Whether, again, FR is particularly rare 
as applied to the final word of a question, I cannot at present say: 
but utterances of this kind do occur. What is perfectly clear is that 
in both ‘yes-no’ questions and ‘special’ questions at least one focus 
for the patterns is quite common: the first word. FR, in these 
circumstances, asks for confirmation or repetition: F + R pleads for 
an answer (or for action). Other possible uses of F+R suggest 
themselves, but further data will have to be collected before they 
can be established as genuine. In view of the doubt cast on the use 
of these patterns for questions, I shall limit my examples here to 
utterances that I have personally heard and noted down. 


a) ‘Yes-No’ Questions 


22. Are “all your family clever? (You obviously are). 

23. Have we “got any coffee? (It’s all very well talking about mak- 
ing coffee, but...). 

24. Have you “much luggage? (A little can easily be conveyed). 

25. “Are you ‘coming? (Despair: Must I wait here for ever?). 

26. ‘Will you sit “down? (Pleading or impatient according to voice 
quality, tempo, etc.). 


b) ‘Special’ Questions 


27. ‘What shall I‘tell him? (I really cannot think of anything). 

28. “How do you like your “coffee? (Intimacy). 

29. “What’s his name? [(i) I have forgotten; 

(ii) I am incredulous]. 

30. When “is he coming? (Several possible dates have already been 
rejected). 

31. How’s the “family? (The remainder of this conversation was 
not heard, but may have included a previous enquiry about the 
health of the person addressed). 


The use of F+ R in the type of pleading question just exem- 
plified seems tantamount to prefixing to the question the words 
‘Do tell me... Thus “Are _you’coming ? seems equivalent to ‘Do tell me 
whether you’re “coming, with the entreaty superimposed, as it were, 
on the question. Further elaboration of the meanings of the two 


10 Phonetica, Vol. 2, No. 3/4, 1958 
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patterns as applied to requests and questions will not be under- 
taken: but it may be said that the ‘contrastive’ meaning of FR 
seems no less evident under these headings, and the reversal and 
expansion techniques may be applied to at least some of the 
F+R examples with results not essentially different from those 
obtained above. Thus even Do ‘smoke may be turned into As far as 
‘smoking goes, ‘do so; and it is worthy of note that ‘do is sometimes 
added as an appendage to requests, thus: Sit ‘down, ‘do. It seems at 
least quite clear that when used as entreaties such sentences are 
not cases of FR. 

As an indication of just how far this distinction may be carried 
for purposes of textual transcription, I append a few miscellaneous 
examples. 


32. Thank you ‘so ‘much. 

33. “So much? (Is “this the quantity you require?). 

34. He went “home, of course (but that’s as far as he got). 

35. He went ‘home, of “course (how stupid of you to ask me where 
he went!). 

36. “Good old ‘Joe! 

37. “All ‘right (Resignation). 

38. You’ve “seen him, haven’t you? (Reassure me). 

39. You’ve ‘seen him, ‘haven’t you? (Confirm). 

40. Hm! A “gloomy place! (Whatever its virtues may be). 

41. Hm! A “gloomy ‘place! (As places’go, its gloomy). 


We have seen that FR and F+R may usefully be set up for 
several broad categories of substrate. Are there, it may be asked, 
any noteworthy grammatical (as opposed to lexically determined) 
limitations on their incidence? This is a question that requires 
detailed study, but a few preliminary remarks may not be out of 
place. 

Since F + R is essentially binary, it is not to be expected that 
it will occur with substrates that are essentially unitary, such as 
single words. Even compound nouns fall, in general at least, under 
the same ban: where certain types might be thought to occur 
with F +R, their status as single words becomes suspect and we 
get, as it were, the impression that the hyphen has dissolved. Thus 
one might, for instance, have Jt was an ‘ordinary “knife, but a ‘fish(-) 
‘fork. Blackbird quite clearly could not stand in such a sentence 
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without losing its identity completely. Thus occurrence or non- 
occurence with F +R — or, indeed, any other compound pattern — 
may well be relevant to the definition of compound nouns. 

Again, we have already seen that a combination of verb and 
clitic pronoun cannot have F +R, and the same restriction applies 
where the element on which the rise would fall is a ‘prop-word’ 
of some kind which cannot normally be stressed. Thus though it 
is possible to say I’ve ‘got ‘one, one has here its full numerical status. 

The incidence of F + R on those verb and ‘preposition’ sequences 
that are often analysed as forming together a single constituent has 
the same disruptive effect as with the compound nouns mentioned 
above, and necessitates a different analysis. Thus we may say J7/l 
“eat with you (but will not accompany you to the theatre afterwards) 
or (rarely) ll ‘eat “with you (our shared activity shall be eating), 
but though Ill “bear with you may mean that [’Il try to be tolerant, 
Pll ‘bear ‘with you suggests communal porterage. 

FR, on the other hand, covers a very wide range, and no limi- 
tations come to mind that seem to be absolute. Such partial restric- 
tions as suggest themselves seem to relate to the feasibility of asso- 
ciation with elements that are in some way ‘incompatible’ with the 
‘contrastive’ function of FR. 

In conclusion, I shall give a brief commentary on the treatment 
of this question by previous writers, ending with the articles by Lee 
and Schubiger mentioned at the beginning of this paper. I hope that 
this commentary, by showing where I feel at variance with pre- 
viously expressed opinions and the examples that illustrate them, 
may serve to make clearer my own point of view. 


Kingdon’? 


Kingdon makes, in effect, no distinction between FR and F +R. 
It might seem at first sight as if his ‘undivided’ variety of Tone III 
were my FR and his ‘divided’ and ‘separated’ varieties were my 
F +R. Indeed, his ‘undivided’ examples are all acceptable as FR, 
and his ‘divided’ and ‘separated’ examples seem to be in general 
F+R. This equation will not stand, however, because a) his 
‘undivided’ examples are all fairly short, and ‘expanding’ them 
appears to involve a change to the ‘separated’ variety; (b) the 


12 Kingdon, 1948. 
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‘divided’ and ‘separated’ examples are not all acceptable as F+ R 
(e.g. on page 120 “Somebody must have ‘taken it, which I cannot 
contextualize except as FR — “Somebody, etc.); c) it is clearly stated 
that “‘the feeling and effect of the overall tone remains... the same 
in all varieties; the unity of the tone is kept intact’’. 

Elsewhere 13, with reference to There was the ‘greatest ‘sarcasm in 
what “fohn said, which appears from the context to be F+R, 
Kingdon says, ‘‘the low rise on John converts the tune into a Tune III 
which invites the listener to go on thinking for himself on the lines 
suggested by the statement, though in this case no particular impli- 
cation is involved’’. This shows once again the confusion of mean- 
ings which bedevils the whole subject. Kingdon cannot, it would 
seem, put his finger on any particular implication, but feels there 
ought to be one. 


Armstrong and Ward*4 


In Armstrong and Ward the reduction to two tunes is carried to 
the point where the term ‘fall-rise’ creeps in, as it were, only by 
accident. The examples shown with falling-rising patterns in the 
Handbook of English Intonation are divided between those given 
under the heading ““Tune I followed by Tune IT” and those given 
under the heading “Variation of Tune II, due to special prominence 
being given to one or more ideas’. The former (p. 35) are all cases 
of final adverbial expressions of one kind or another, which, as has 
already been said, are more regularly diagnosed as F + R than any 
other type of sentence. They are said to “share the characteristics 
of Tune IT — i.e. lack of definiteness, a possibility of adding further 
remarks”. The inadequacy of this type of description has already 
been pointed out. The second group includes statements, requests 
and questions, the first two being shown with medial syllables, if 
any, on a low level pitch, the questions with a rise beginning 
immediately after the fall. The requests are all acceptable as F+ R 
and the questions as FR, but the statements (pp. 58-61) are not 
homogeneous. For instance, the first two examples on p. 59 — 
‘Talking wouldn’t have been any “good and I ‘can’t make it without “eggs — 
are almost certainly intended as FR and F +R respectively, whe- 
reas the third — She ‘said it didn’t “matter — could equally well be taken 


13 Kingdon, 1949, p. 181. 
14 A Handbook of English Intonation. 
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as either FR (but she was really very cross about it) or F+R (so 
why didn’t you carry on?). This ‘variation of Tune II’ is stated to 
show “in all cases a lack of finality”. For such of the examples at 
any rate as are F +R this cannot be maintained. 


Jones t® 


Jones feels the usual difficulty. In § 1056 of the ‘Outline of 
English Phonetics’ we read: “The intonation described in §§ 1051-55 
(a modification of Tune II, according to Jones - AES) is sometimes 
used in cases where there does not appear to be any obvious con- 
trast, and where it is difficult to specify the reason for the use of the 
intonation. Notable cases are expressions of regret and entreaties 
or urgent requests.”’ Precisely: it is difficult to specify the reason 
for the the use of the intonation, because that intonation (FR by 
implication) is, in fact, not used. 


Jassem '6 


Despite his elaborate subdivision of English intonation patterns, 
Jassem’s falling-rising examples are as unsatisfactory as any yet 
published. A detailed examination of those examples would be out 
of place here: but it is worthy of note that in connexion with his 
‘low falling NT (= nuclear tone — AES) followed by the low rising 
NT? (p. 81), of which the instances given are very mixed, he himself 
says, ‘“Palmer’s Rising-Falling-Rising Nucleus seems to be used in 
similar cases as my combination: low-falling NT plus low-rising 
NT.” His first example — He’s not an ‘ordinary “monkey — is a most 
improbable utterance as F+R. 


Allen +7 


On p. 86 of ‘Living English Speech’ we find: “In some form or 
another the emphatic pattern of Tune II is extremely common in 
English, as we so often make remarks which carry with them some 
implication which is not put into words but is quite clearly ex- 
pressed by the final rising intonation.”’ Of the illustrative examples 
I select “All children have to do as they’re “told (surely F + R?) and the 


15 An Outline of English Phonetics. 
16 Intonation of Conversational English. 
17 Living English Speech. 
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immediately following ‘This material’s very ‘poor (ambiguous but 
probably intended as FR: F+R could stand in the sense “This 
material too’ or ‘This material, for example’). 

Allen appears to be guilty of the much rarer solecism of confusing 
FR and F+R with ordinary ‘Tune II’. Thus he gives (p. 55) 
‘Don’t ‘hurt the “poor thing and (p. 97) ‘Have a “heart. The first (surely 
“hurt?), hard though I have tried to contextualize it, I still find 
little short of ludicrous; and the second strikes me as an improbably 
casual intonation for a form of words regularly associated with 
entreaty, and which is in my experience normally heard as “Have 
a ‘heart. 


Palmer 38 


It is a relief to acknowledge that Palmer, though he virtually 
ignores problems of stress and excludes FR from questions, is, 
within these limitations, rarely in error. It is a little hard, therefore, 
to find that for his perspicacity he was actually taken to task by 
Schubiger (in an earlier article)! for marking differently sentences 
with identical intonations and using the same notation for dissi- 
milar sentences. The examples she quoted in this connexion are, in 
my view, all perfectly sound. 


MacCarthy ° 


The places where I find myself in disagreement with MacCarthy 
are mostly cases of his indicating F+R where I feel that FR is 
required. On page 58 of his ‘English Conversation Reader’ we find 
That ‘certainly ‘is the ‘quietest “time. Now the point surely is that the 
time in question is the quzetest, but in practice unsuitable. The 
prominence given to ‘time’ is unnecessary in this context. The 
sentence is not, it seems to me, of the same order as my example 16: 
as marked by MacCarthy it indicates that when everyone is asleep 
things are very quiet indeed, which is more or less self-evident, and 
fails to indicate the contrast between that high degree of quiet — 
apparently so conducive to prolonged reading — and its uselessness 
in practice. Again, on page 64 we find “that wouldn’t “do in a context 
which clearly indicates a contrast between ‘that’ (an unsuitable 


18 English Intonation with Systematic Exercises. 
19 Schubiger, 1946, p. 132, n. 5. 
20 English Conversation Reader. 
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example that has been suggested) and the correct examples that 
have still to be found. Similarly, on page 65 we find “J don’t “know, 
which in the context obviously implies that one would need to ask 
someone else. There are one or two other similar examples. 


Lee? 


In making the distinction between TONE and SEQUENCE, Lee 
states that in the case of the former the rise can begin at once after the 
fall. With this I agree: but he goes on to say that it need not begin 
at once “unless there is danger of confusion’’. I find it difficult to 
accept that the danger of confusion has very much to do with the 
shape of a spontaneous utterance. I think we must just accept that 
confusion can, and does, sometimes occur. In the same way, when 
Lee states that in She doesn’t speak to “anybody she meets along the road 
the rise must start within anybody, whereas in She doesn’t speak to “any- 
body she meets along the “road it must not, I fear that, desirable though 
this compulsion might be, he is rather overstating the case. 

According to Lee, “‘sometimes the distinction of usage’’ is not 
to be seen “‘so that “Do make haste and “Do make ‘haste appear to be 
equivalent, as do “ That doesn’t matter and ‘That doesn’t “matter”. It is 
not entirely clear what Lee means by this. From what he has said 
earlier, we may presume that he considers that there is no important 
distinction of meaning, and that therefore these sentences do not 
need to be kept apart in pronunciation. What kind of pronun- 
ciation do we, then, in fact, get? It is, however, perfectly clear what 
all four sentences would mean if used, and the fact that “Do make 
haste is an extremely improbable utterance does not alter this. 
“That doesn’t matter is no doubt much more common than * That 
doesn’t “matter, but the latter may mean, for instance, ‘“‘Even that is 
no cause for worry’’. Similarly, when Lee says that Kingdon’s sentence 
Not “ail the doctors in the world could “cure him might equally well have 
FR (i.e. ‘all) without change of meaning, I am entirely unable to 
agree. As marked — that is, with F +R — it means that the combined 
attentions of the world’s doctors would be (or were) unavailing, 
whereas with FR it might be the boast of one of the few doctors 
who could cure him. 

The role of FR in questions, about which Lee shows some 
reserve, has already been dealt with in the appropriate place. 


21 Fall-Rise Intonations in English. 
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Schubiger ?* 


It is impossible to get a clear idea from what Schubiger says in 
her recent paper how far she considers that the various patterns 
she sets up differ or do not differ in their exponents. Though she 
mostly seems to imply that Types 1-3 are practically indistinguish- 
able, it is only fair to add that she seems vaguely aware of the pitch 
differences I have spoken of in my own descriptions of FR and 
F+R. In dealing with the differences between her Type I (my 
F+R) and her Type 2 (my FR), she says, in a very obscure 
passage: “‘ There were ‘seven of ‘them. I’ve for gotten it ‘now. We disa gree 
with each other might be both | and 2, though 2, which is an emphatic 
variant of Tune II, has probably a wider pitch-range. One can 
also bring out the difference by saying the sentence in the same 
mood and dropping the last words.’ Now by ‘bring out the dif- 
ference’, coupled with her failure to indicate any preference, Schu- 
biger presumably implies that the examples given might be found 
with either pattern. On the other hand, her use of though does not 
help this interpretation. If it zs implied that both FR and F+R 
are to be found on the substrates given, the examples seem parti- 
cularly ill chosen. I’ve forgotten it now is most unlikely to be FR, and 
We disagree with each other equally unlikely to be F+R. The latter 
case would give us a meaning something like ““What we do with 
each other is to disagree’. 

Schubiger’s Type 3 examples are almost all instances of my 
F+R, and Lee likewise suggests that they might be considered as 
belonging to a sub-class of his Sequence. The ‘odd man out’ in 
Schubiger’s examples is That’s “funny. This substrate, which Allen 
gives as 'That’s “funny, is in my speech usually associated with FR, 
that is, “That's funny. I do not understand how Schubiger decides 
when a sentence belongs to Type 3. I presume that the identifi- 
cation of the rise as the nucleus depends on the ‘existence’ of a 
‘variant’ with a rise without a preceding fall, but must this be the 
only variant, for instance? Lee evidently understands the technique 
better than I, since he produces an example of his own — It ‘wasn’t 
in the “middle — which, however, I can see no good reason for allotting 
tovl Vpers, 
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Summary 


I may summarize my findings as follows. Over a wide range of 
English sentence-types it is necessary to differentiate between two 
closely similar falling-rising intonation patterns, one of which may 
be regarded as unitary, the other (F +R) as binary. I prefer to 
restrict the term ‘fall-rise’ to the unitary pattern. As abstracted 
from large numbers of utterances, the two patterns may be formally 
distinguished by criteria of pitch and rhythm, but their exponents 
shade off into each other in such a way that in any given instance 
it may be difficult or impossible to recognize by ear alone which 
pattern is to hand. These formal differentiae are found, however, 
to correlate with ‘meanings’ which are difficult to summarize, but 
which for each pattern seem broadly reducible to an unity over a 
high proportion of all utterances so characterized. These meanings, 
once appreciated, may be used diagnostically both in listening to 
ambiguous data and for purposes of textual transcription. Existing 
textual material shows a great deal of inconsistency in this respect. 

I am fully conscious of the deficiencies of this study. More 
particularly, some of my readers may well find my descriptions of 
the ‘meanings’ of FR and F+R of little value to them. In case, 
however, there are those who would challenge the very propriety 
of attempting such descriptions, I must emphasize yet again that the 
formal criteria for the differentiation have absolute priority, and 
that such hints of a more notional kind as I feel able to give are 
introduced only in order to make the distinction more credible 
and to enable others to re-examine the phonic data for themselves. 
Eighty years ago Henry Sweet found it necessary to write: “The 
whole relation of tone to language has as yet been only imperfectly 
studied’’, and his words remain essentially true today. If the study 
of this relationship is not to remain for ever the Cinderella of the 
linguistic sciences, then intonation must put its own house in order; 
and in our efforts to facilitate and, if possible, accelerate that 
process, we shall need all the resources that we can muster. 


Kusammenfassung 


Fir sehr viele englische Satztypen ist es notwendig, zwischen zwei ziemlich ahn- 
lichen fallenden-steigenden Intonationsformen zu unterscheiden. Die eine ist einheitlich, 
die andere zweigliedrig. Der Ausdruck fall-rise wird nur fiir die einheitliche Form an- 
gewandt. Beide Formen kénnen durch Tonhéhe und Rhythmus unterschieden werden, 
aber sie gehen in Grenzfallen so ineinander tiber, daB es gegebenenfalls schwierig 
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oder unméglich ist, allein durch das Ohr zu unterscheiden, welche Form vorliegt. Die 
formalen Unterschiede hangen mit «Bedeutungen» zusammen; diese sind schwer zu- 
sammenzufassen. Es scheint aber, daB diese Bedeutungen sich fiir jede der beiden 
Formen itiberhaupt auf eine Einheit zuriickfiihren lassen. Wenn man diese Bedeutun- 
gen erst einmal bemerkt hat, kann man sie zur Diagnose verwenden sowohl beim 
Horen unbestimmter Rede als auch bei Textumschriften. Die bisher vorliegenden Texte 
stimmen in dieser Hinsicht wenig iberein. 


Résumé 


Pour bien des genres de la phrase anglaise, il faut distinguer entre deux mélo- 
dies de type descendant-ascendant assez semblables. L’une est unitaire, l’autre binaire. 
L’expression fall-rise sera employée uniquement pour la mélodie unitaire. Les deux 
mélodies se distinguent par la hauteur et par le rythme: cependant, dans les cas limites, 
elles empiétent l’une sur l’autre a tel point qu’il est souvent difficile, ou méme impossi- 
ble a Voreille seule de décider de quel type il s’agit. Aux différences formelles cor- 
respondent des «sens»; ceux-ci sont difficiles 4 résumer. I] semble cependant, que, 
pour chacun des deux types, ces sens se laissent dans l’ensemble réduire a4 Punité. Si 
lon a une fois pris note de ce sens, on peut l’employer comme critére aussi bien pour 
le discours ambigu a loreille que pour les transcriptions écrites. De ce point de vue, 
il y a peu d’accord dans les textes dont nous disposons jusqu’a présent. 
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Aus dem Phonetischen Laboratorium des Sprachwissenschaftlichen Instituts der 
Akademie der Wissenschaften in Ungarn 


Neuere Untersuchungen 
tiber die ungarischen Affrikaten 


Von LUDWIG HEGEDUS, Budapest 


1. In den dreifiger Jahren wurde in Ungarn anschlieBend an 
Anton Horgers Artikel «Was ist eine Affrikate?» eine Affrikaten- 
debatte in den Spalten der Zeitschrift Magyar Nyelv eingeleitet?. 
Nachdem Horger die phonetische Natur der ungarischen Affrikaten 
untersucht hatte, gab er seine friihere Meinung auf, da8 namlich 
die Affrikate die Verbindung eines VerschluBlautes und eines hom- 
organen Engelautes sei, und kam auf Grund seiner Beobachtungen, 
noch mehr auf Grund lautgeschichtlicher Angaben zu dem Resul- 
tat, daB die Affrikaten «Einzellaute sind und die Dauer ihrer 
Bildung auch nicht langer ist als die der kurzen Einzelkonsonanten». 
Im weiteren: «Wir bilden und héren nur einen Laut... in dem die 
akustischen Wirkungen des VerschluBlautes und des... Engelautes 
miteinander vermengt sind.» In meinen Artikeln «Zur Frage der 
Affrikaten?» und « Phonetische Randbemerkungen*» kam ich auf 
Grund von experimentalphonetischen Aufnahmen und Dauer- 
messungen im Gegensatz zu Horgers Feststellungen zum Resultat, 
daB die Affrikaten in artikulatorischer Hinsicht keine einheitlichen 
Laute sind: «a) bei der Bildung der Affrikaten konnen zwei Mo- 
mente beobachtet werden, und das eine weist die charakteristische 

1 Horger, 1935, S. 210-218; 1936a, S. 100-103; 1936b, S. 259-260; 1942, S. 285-286. 
Hegediis, 1936a, S. 17-20; 1936b, S. 189-191. Madzsar, S. 103-106. Kelemen, S. 119. 
Hartnagel, S. 319-321. Laziczius, 1937, S. 76-82. Baké, 1942a, S. 167-172; 1942b, 
§..357-358; 1937, S: 35-97. 


2 Hegediis, 1936a, S. 17-20. 
3 Td.: 1936b, S. 189-191. 
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Bildungsweise der VerschluBlaute, das andere die der Engelaute 
auf; b) die Zeitdauer der Bildung der Affrikaten ist betrachtlich 
langer als die der kurzen Konsonanten!»; der VerschluB und die 
Enge werden nicht gleichzeitig gebildet, sondern folgen zeitlich 
aufeinander, und da ihre Bildung an derselben oder an einander 
sehr nahe liegenden Stellen erfolgt, passen sich ihre Artikulations- 
momente einander an2. Auch hielt ich fiir wesentlich, das Artiku- 
lationsmoment und das akustische Moment auseinanderzuhalten. 
Akustisch hat namlich die Klangfarbe der Affrikaten einen ziemlich 
breiten Spielraum. Der Eindruck, den der Laut ¢ (ts) macht, wird 
im allgemeinen einheitlicher aufgefaBt als der des dz: «Die Affri- 
katen des ungarischen Wortes cica ,Katzchen‘ konnen von einzelnen 
eher als Einzellaute empfunden werden (da ¢ mit einem Buchstaben 
bezeichnet wird) als z. B. die der Worter bodza ,Holunder‘, findzsa 
sTasse‘, léndzsa ,Lanze‘ usw. Hier kann jeder, auch ohne scharfe 
Ohren zu haben, den Doppelcharakter der Affrikaten erkennen *. » 

Im Verlaufe der Debatte wurden manche Fragen berihrt, 
doch selbst nach der Zusammenfassung der Debatte durch Laziczius 
wurden die Begriffe nicht befriedigend geklart*. Der Grund hierftr 
war, daB Laziczius keine einschlagigen phonetischen Untersuchun- 
gen angestellt und die Feststellungen der Debattierenden nicht mit 
Messungen und phonetischen Untersuchungen kontrolliert hatte 
und seine Meinung ausschlieBlich auf eine Arbeit Belgeris® griin- 
dete, indem er dessen SchluBfolgerung annahm: «Die Affrikate 
ist ein gemischter Laut (,un phoneme mixte‘), der ganz eigenartig 
gebildet wird. Die Bildungsweise der Affrikate steht in der Mitte 
zwischen der Bildungsweise des VerschluBlautes und des Enge- 
lautes. Sie ist mit keinem dieser Laute identisch, auch keine Summe 
der beiden. Sie ist nicht einmal ein einfacher Ubergang von einem 
zum, anderen, sondern die Verschmelzung der beiden, die oft voll- 
kommen, noch 6fter aber unvollkommen ist®. » 


1 Hegediis, 1936b, S. 191. 

2\Id.: 1936a;, S. 19: 

3 Id.: 1936b, S. 190. 

* Laziczius, 1937, S. 76-82; 1944, S. 78-84. 

> Belgeri, 1929. 

® Laziezius, 1937, S. 81. Auf die Unhaltbarkeit von Belgeris «phonéme mixte» hat 
auch J. Forchhammer (Arch. Néerl. Phon. Exp. 17; 12, 1941) hingewiesen: «Wenn z. B. 
Belgeri... von einer Vermischung von VerschluBlaut und Engelaut spricht, so ist dazu 
zu bemerken, daB eine solche Vermischung tiberhaupt nicht stattfinden kann; denn, 
wenn es auch modglich ist, wahrend eines Verschlusses eine Enge zu bilden, so kommt 
diese Enge jedoch erst nach der Lésung des Verschlusses phonetisch zur Geltung.» 
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2. Durch die Auffrischung der Belgerischen Theorie wurde 
aber die Frage bei weitem nicht geklart, die Verwirrung ist vielmehr 
noch gréBer geworden. Dies erhellt auch aus E. Bakés Affrikaten- 
studie?: «In phonetischer Hinsicht konnen wir die Sache selbst 
nach dem reichen Material und den Feststellungen Belgeris nicht 
fiir abgeschlossen halten, denn die Frage ist noch offen geblieben, 
was die Affrikate von phonetischem Gesichtspunkt aus ist®. Baké 
sucht die ratselhafte Natur der Affrikaten auf Grund von Kymo- 
grammen und Palatogrammen aufzuhellen, seine Aufnahmen legt 
er aber willkirlich aus. Seine Kymogramme zeigen deutlich das 
Moment VerschlufS + Enge, von seinen Palatogrammen weisen dz, 
gy (d'j') und ty (t'%) vollkommene VerschluBbildung, ¢ (ts), 
cs (tS) und dz verminderte Engebildung auf, und trotzdem lautet 
seine SchluBfolgerung fiir die Artikulation folgendermaBen: «Bei 
der Bildung der Affrikaten lassen sich drei Momente beobachten: 
ein engeverminderndes, ein engeerhaltendes und ein engeerweitern- 
des Moment*.» Ihrem VerschluBelement schenkt er kaum eine 
Beachtung, und ihren Platz weist er einfach in der Gruppe der 
Engelaute an: « Die ungarischen Affrikaten sind mit stark vermin- 
derter Zungenenge gebildete Engelaute.» Es liegt auf der Hand, daB 
die Zuteilung der Affrikaten zu den einfachen Engelauten nicht 
annehmbar ist, da dies jeder Art von subjektiver Beobachtung und 
experimentalphonetischer Analyse vollkommen widerspricht. Des- 
halb weist Horger eine derartige Auslegung Bakés zuriick*: « Daf die 
Affrikaten keine VerschluBlaute, sondern Engelaute sind (die eine 
schmalere Enge als die anderen haben), kann ich keineswegs zu- 
geben.» Und: «Nie, kein einziges Mal habe ich beobachtet, dal 
ich nicht einen VerschluB, sondern eine mehr oder minder schmale 
Enge gebildet hatte. » 

Von dieser Kritik beeindruckt zog dann Baké seine Engelaut- 
theorie zuriick und teilte die Affrikaten in die Gruppe der Halb- 
verschluBlaute («semiexplosivae») ein — nicht anders als Belgeri —: 
« Die Kategorie der HalbverschluBlaute steht in der Mitte zwischen 
der Gruppe der VerschluBlaute und der der Engelaute, so hat sie 
auch im System der ungarischen VerschluBlaute zwischen den 


1 Phonetische Studien (ungarisch). Debrecen 1937. 
274, a..Os, 9: 30. 

Sey Gigl On 5 wel 

4 Horger, 1942, S. 286. 
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beiden Gruppen ihren Platz}. Die Zuordnung zu den Engelauten 
hat also Baké am Ende selbst fallenlassen, trotzdem taucht die 
« Engelauttheorie» sowohl in der ungarischen als auch in der aus- 
landischen Fachliteratur noch immer auf. 

Die Beurteilung der Affrikaten ist noch immer sehr unsicher, 
und diese Unsicherheit kann im Universitats- und Hochschulunter- 
richt wie auch in den Debatten iiber die ungarische Rechtschrei- 
bung verfolgt werden. Auf die Widerspriiche der Notizenhefte und 
Handbiicher habe ich bereits an einem anderen Ort hingewiesen. 
Aus dem Gesagten geht klar hervor, daB die Frage der Affrikaten 
noch nicht in zufriedenstellender Weise geklart ist und die Sprach- 
forscher durch dunkle Erklarungen nicht befriedigt werden konnen. 
Die Unsicherheit der Beurteilung hat nicht nur bei uns, sondern 
auch im Kreise auslandischer Phonetiker und Sprachforscher leb- 
hafte Auseinandersetzungen entfesselt, und es wurden an vielen 
Orten niitzliche experimentalphonetische Analysen angestellt, um 
die eigenartige Natur der Affrikaten zu erkennen. Nach Belgeris 
Analysen habe ich die Ergebnisse meiner experimentalphonetischen 
Untersuchungen beziiglich der ungarischen Affrikaten in meinem 
Aufsatz «Die Natur der ungarischen Affrikaten?» verdéffentlicht. 
E. Richter hat in ihrer Studie « Die italienischen ¢- und S-Laute?» 
italienische Affrikaten von vielen Seiten her analysiert. 7. Forch- 
hammer hat E. Richter kritisiert* und in seinen Arbeiten « Kern- und 
Wendepunkt der Sprechwissenschaft*», «Zum Affrikaten-Pro- 
blem®» wie auch in seiner «Laletik’» manche Einzelheiten der 
Affrikatenfrage geklart. An der Debatte beteiligte sich auch 
D. Gerhardt®, und auch in Amerika kam es zu Debatten iiber die 
Affrikaten®. Unlangst hat sich der hervorragende tschechische 
Phonetiker B. Hdla mit dieser Frage eingehend beschaftigt !°. 

Nach den ausgetragenen Debatten, hauptsdchlich aber auf 
Grund experimentalphonetischer Untersuchungen, beurteilen wir 


1 Belgeri, S. 170. 

2 Hegediis, 1939, S. 97-102. 

3 Richter, S. 1-38. 

4 Forchhammer, 1941, S. 9-20. 

Pd NOS lays 23-503 

6 Td., 1953, S. 403-408. 

Zelda O Dilip: 

8 Gerhardt, 1948, S. 95-96; 1952, S. 57=76. 
9 Martinet, S. 116-122. 

10 Hala, S. 77-93. 
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vielleicht die Affrikaten richtiger; wir kénnen auch sehen, was die 
Faden dieser Frage verwirrt hat, warum wir so langsam vorwarts- 
gekommen waren. 

3. Bei der richtigen Beurteilung der Affrikaten hatte ohne 
Zweifel die groBte Verwirrung der Umstand hervorgerufen, daB 
die Debattierenden und die Forscher ihre von verschiedenen Ge- 
sichtspunkten aus gemachten Beobachtungen nicht auseinander- 
gehalten hatten. Mit Recht hat 7. Forchhammer im Zusammenhang 
mit E. Richters Untersuchungen auf diesen Grundfehler hingewiesen, 
die (d. h. Richter) — wie auch viele andere — den zusammengesetzten 
Charakter der Affrikaten sowohl in artikulatorischer als auch in 
akustischer Hinsicht nachgewiesen und trotzdem die SchluBfolge- 
rung gezogen hat, daB sie «einheitliche Laute» sind: «Wenn die 
von £. Richter angefiihrten Forscher, trotzdem sie selber den zu- 
sammengesetzten Charakter der Affrikaten nachgewiesen haben, 
doch fast ausnahmslos zu dem Ergebnis kommen, die Affrikaten 
seien ,einheitliche Laute‘, so diirfte das in erster Linie auf einer 
Verwechslung der beiden Begriffe ,Sprachlaut‘ und ,Phonem‘ be- 
ruhen?.» Auch die bei uns ausgetragene Affrikatenpolemik hatte 
ohne Zweifel den Hauptfehler, da artikulatorische und phone- 
matische Gesichtspunkte bunt miteinander vermengt waren und 
da die Debattierenden je nach ihrer Einstellung einmal dem 
artikulatorischen, ein anderes Mal aber dem phonematischen Ge- 
sichtspunkt den Vorzug gegeben hatten. 

Heute sehen wir bereits klar, daB wir die Affrikaten nach drei 
Gesichtspunkten zu analysieren haben. Wir miissen untersuchen 
1. von der physiologischen Seite her den genauen Ablauf der Artikula- 
tion, 2. von akustischem Gesichtspunkt aus das Klangbild und den auf 
die Zuhérer gemachten akustischen Eindruck, endlich 3. das dies- 
beziigliche Urteil der Glieder der Sprachgemeinschaft, den Phonem- 
wert der Affrikaten. 

4. Ich untersuchte die einzelnen Momente der Artikulation der 
Affrikaten an Palatogrammen, Kymogrammen, Oszillogrammen, 
an Bildern, die mit automatischem Tonhdhenschreiber gemacht 
wurden, und endlich an Schalldruckaufnahmen. 

a) Die Palatogramme geben AufschluB tiber den Umfang und die 
Form der Beriihrungsflache von Zunge und Gaumen, sie geben 
aber naturgemaB kein Bild vom zeitlichen Verlauf der Artikula- 


1 Richter, S. 10-11. 
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tionsmomente. Meine Palatogramme zeigen, daB in meiner Aus- 
sprache bei der Bildung ungarischer Affrikaten immer VerschluB- 
bildung vorhanden war. Der Verschlu8 der Laute ¢ (ts) und dz 
wird in alveolarem, der der Laute cs (t5) und dzs (dz) in postalve- 
olarem und der der Laute ty (t/~) und gy (d‘j’) in postalveolarem 
bzw. palatalem Gebiet gebildet. Die VerschluBbildung erfolgt im- 
mer etwas mehr nach hinten als bei ¢t (t), weil sie sich an die Stelle 
des folgenden s-Elementes anpaBt. Der VerschluB ist also ein sehr 
wichtiges Moment der Affrikatenbildung, und unseres Erachtens 
kann diese Tatsache bei ihrer Beschreibung nicht iibersehen werden. 
Die Beriihrungsflache von Zunge und Gaumen ist je nach den 
Affrikatentypen und der Zeitdauer verschieden. Verhaltnismabig 
am kleinsten ist sie bei dz und ¢ (ts)1, etwas gréBer bei dzs (dz) 
und cs (t) und naturgema8 am gréBten bei der langen palatali- 
sierten Gruppe, bei den Lauten gy (d’j’) und ty (t'%). Bei der 
Bildung dieser beiden letzteren Laute decken sich Palatalisation 
und Affrikation. Das spirantische Element entsteht zusammen mit 
der Sprengung der auf einer groBen Flache erfolgten VerschluB- 
bildung und ist eine notwendige begleitende Gerauscherscheinung. 
In den phonetischen Einteilungen werden sie (gy, ty) gerade deshalb 
bald der Gruppe der palatalisierten Laute, bald den Affrikaten 
zugeteilt. An Palatogrammen kann auch noch beobachtet werden, 
daB die Berithrungsflache der stimmhaften Affrikaten kleiner ist als 
die der entsprechenden stimmlosen, weil die Verschlu8bildung mit 
kleinerer Muskelspannung erfolgt. 

Meine Palatogramme zeigen ebenso wie die Gaumenbilder von 
K. Gombocz?. F. Balassa*®, Rousselot*, B. Csiiry® und B. Vass® bei der 
Artikulation eine VerschluBbildung. Sie weichen aber stark von den 
Palatogrammbildern von E. Baké? ab, auf dessen Palatogrammen 
c (ts) eine Enge, sein stimmhaftes Korrelat dz aber — das mit viel 
schwacherer Muskeltatigkeit gebildet wird — einen vollen Ver- 
schlu8 zeigt! Wir halten es fiir natiirlich, daB auch die Affrikaten 
bei der Aussprache der Glieder einer Sprachgemeinschaft einen 


1 Hegediis, 1941/43, S. 64-73; 1955, S. 181-214. 
2 Gombocz, S. 193-204. 

3 Balassa, S. 85. 

4 Rousselot, S. 609. 

5 Csiiry, S. 67. 

6 Vass, S. 40-43. 

7 Bako, 1937, S. 48-56. 


uber die ungarischen Affrikaten 159 


gewissen Schwankungsbereich haben!, die Bildung ohne VerschluB 
bezeichnet aber offenbar nur die auBerste Grenze dieses Schwan- 
kungsbereiches, und nicht die verbreitetste Bildungsweise. So etwas 
kann hauptsdchlich bei sehr schnellem Sprechen vorkommen, wo 
die auf die Artikulation verwendete Zeit in hohem MaBe verkiirzt 
wird und so die Reduktion der Zeitdauer der einzelnen Elemente 
hochgradig sein kann. Der Umfang der bei der VerschluBbildung 
entstehenden Beriihrungsflache wachst in geradem Verhiltnis zum 
Anwachsen der Zeitdauer?, eben deshalb kénnen wir bei der langen 
Variante der Affrikaten sowohl das Verschlu8element als auch das 
Engeelement deutlich wahrnehmen und unterscheiden. 

b) Von Kymogrammen kénnen wir auch das Nacheinander der 
Artikulationsmomente der Affrikaten ablesen®: zwerst tritt das Bild des 
Verschlusses hervor, danach das des Engeelementes. Die beiden kann man 
voneinander abgrenzen, ihre Dauerverhaltnisse sind aber je nach 
Affrikatentypen verschieden. 

c) Auf Oszillogrammen konnen wir die Momente der Bildung 
noch eingehender studieren. Die Kathodenrohre registriert namlich 
die Sprechlaute frei von Tragheit. 
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cs (t&): Die erste Abbildung zeigt das Oszillograinm des ungari- 
schen Wortes mocsok «Schmutz». Nach den Wellen des Lautes 0 
sehen wir das Bild des VerschluBelementes, aus dem sich das Ge- 
rauschelement § von hoher Frequenz mit allmahlich steigender, 
dann abnehmender Amplitude hervorhebt. Der reduzierte Ver- 
schluBlaut (Dauer: 5 y) und der Engelaut (10 y) werden also nicht 
gleichzeitig und miteinander vermengt gebildet — wie es Belgert, 
Horger, Laziczius und noch viele andere gemeint haben -, sondern in 
zeitlichem Nacheinander. Es trifft also nicht zu, was Laziczius sagt: 
«das ganze Registrat (zeigt) eine unanalysierbare Einheit, die 


1 Auch in der Arbeit «Polskie Affrykaty» von Maria Dluska k6nnen wir eine ge- 
wisse Schwankung bei der Artikulation beobachten. Von den 9 Palatogrammen der 
polnischen Laute ts und tf weisen sieben volle, zwei aber unvollkommene VerschluB- 
bildung auf. 

2 Hegediis, 1941/43, S. 64-74; Stetson, Hudgins and Moses, S. 52-61. 

3 Meyer und Gombocz, 1909; Hegediis, 1936a, S. 17-20; 1939, S. 97-102. 


11 Phonetica, Vol. 2, No. 3/4, 1958 
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nicht in ihre Elemente zergliedert werden kann. Es kann also 
keineswegs gesagt werden, wie lang der Kurventeil des VerschluB- 
elementes anzusetzen ist und wo der Kurventeil des Engeelementes 
beginnt?.» Im Gegenteil: man kann die zwei Elemente genau von- 
einander abgrenzen. 


Auf Abbildung 2 (csacsi « Eselchen», «Eselfohlen») sehen wir 
einen dhnlichen Fall. Hier hebt sich auch das zischende Laut- 
element des cs (t«) am Anfang des Wortes plastisch hervor. Auf 
Oszillogrammen, die von langen Affrikaten mit groBer Geschwin- 
digkeit gemacht wurden (Abb. 3: rdccsal [rat8al] «mit Gitter», 
Abb. 4: doccsan [lot84n] «platscht»), treten die zeitlich aufeinander- 


folgenden Affrikatenelemente noch anschaulicher hervor. DaB das 
zweite Element der Affrikate in der Tat dem Laut § gleich ist, wird 
auch durch akustische Teiltonanalysen bestatigt. Meine Versuche mit 
Oktavsieben haben gezeigt, da sowohl das s-Element der Affri- 
katen als auch die s-~Laute die charakteristische Frequenzstelle beim 
Stand [.2400-—4800 Hz bzw. II. 3200-6400 Hz des Gerates hatten. 
AuBerdem kann uns die Vergleichung mit den Oszillogrammen 
der Worter, die einen s-Laut enthalten, von ihrer Identitat iiber- 
zeugen (Abb. 5: kese [keSe] «falb»; Abb. 6: mise [miSe] «Messe»). 


1 Laziczius, 1944, S. 80-81. 
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dzs (dZ): Die artikulatorische und akustische Zweigliedrigkeit 
des stimmhaften Korrelats des cs ist in den Oszillogrammen eben- 
falls gut wiedergegeben. Die Amplitude der Wellen des mit redu- 
zierterer Muskeltatigkeit gebildeten VerschluBelementes (d) ist klein, 
und seine Dauer ist kurz (Abb. 7: findzsa [findza] «Tasse» und 
Abb. 8: ldéndzsa [landza] «Lanze») bzw. lang (Abb. 9: maharadzsa 
[maharadza «Maharadscha») ; es ist auch vom Element Z, das mit 
Gerauschen von hoher Frequenz gebildet wird, deutlich abgrenzbar. 

c (ts): Was den zeitlichen Ablauf der Bildung der Affrikate c 
betrifft, so ist er dem der vorigen gleich. Das Zischelement folgt 
zeitlich immer auf das VerschluBelement, seine Dauer ist langer als 
jenes und «vermengt» sich nie mit ihm vom Beginn der Bildung an 
(Abb. 10: ecet [etset] «Essig», Abb. 11: ruca [rutsa] «Ente», 
Abb. 12: cica [tsitsa] «Katzchen»). Die Dauerreduktion des Ver- 
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schluBelementes ist im allgemeinen bei den Affrikaten nach 2 am 
erheblichsten (Abb. 13: éuyenc [in’ents] « Feinschmecker»). Bei lan- 
gen Affrikaten wird nicht nur das VerschluBelement, sondern sehr 
oft auch das Engeelement gelangt (Abb. 14: ruccan [rutsan] «einen 
Gang oder Fahrt tun»: ¢ = 10,1 9, s = 20,2 9; Abb. 15: bdiccen 
[bitsen] «eine kleine wackelnde Bewegung tun»: ¢ = 13,7 9, 
5 = 16,5 9). Es ist also klar, daB der Affrikatencharakter nicht aus- 
schlieBlich durch die Dauerreduktion der Elemente herausgebildet 
wird, sondern durch andere Reduktionserscheinungen, die infolge 
der Assimilation (richtiger: Anpassung) entstehen — wovon weiter 
unten noch die Rede sein wird. 


dz: Hier ist die Abgrenzung der beiden Elemente der Affrikate 
natiirlich nicht so plastisch wie bei ihrem stimmlosen Korrelat, 
aber doch ausgesprochen, denn die Geradusche von hoher Frequenz 
(I. 4800-9600 Hz bzw. II. 6400-12800 Hz) bezeichnen deutlich 
die Bildungsphase des zweiten Elementes (Abb. 16: brindza [brind- 
za] «eine Art Schafkase»: d = 5 y, z = 10 y; Abb. 17: edzé [edz6] 
«Trainer 3d = 4) Otel) 
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ty (t'y’): Wahrend in der vorigen Gruppe der Affrikaten — 
zum mindesten in den kurzen Varianten — eher das VerschluB- 
element hinsichtlich der Dauer reduziert war und das Engeelement 
dominierte, verhalt es sich bei den palatalisierten Lauten eben um- 
gekehrt. Das hauptsachliche Moment der Artikulation ist hier die 
auf groBer Flache erfolgende Verschlufbildung, mit deren Auflésung 
zwangslaufig Reibegerausche entstehen. Die Verbindung: Ver- 
schluBlaut + homorganer Engelaut tritt hier also wie in den oberen 
Typen auf. Auf Abbildung 18 sehen wir das Oszillogramm des 
Wortes atydm (at’y’am) «mein Vater». Das VerschluBelement der 
Affrikate ty (t’y’) kann auch hier vom gerauschhaften Engeelement 
abgesondert werden. Die Dauer des Verschlusses ist bei der kurzen 
Variante etwas langer als die des spirantischen Elementes (¢’ = 
10,5 y, x’ = 7,5 ¢). Bei ihrer langen Variante (Abb. 19: Jottyan 
[loty’4n] «platscht»: #’ = 28,5 y, x’ = 6 ¢) ist die Dauer des Ver- 
schlusses 4,7mal groBer als die des spirantischen Elementes. Das 
zweite Element ist, wie gesagt, eine zwangslaufige begleitende Ge- 
rauscherscheinung, deren Dauer vom Sprechenden nicht so will- 
kiirlich verlangert werden kann wie die des Verschlusses. 


gy (dj'): Auch im Korrelat des vorigen Lautes ist der Stimmton 
im zweiten Element mit Reibegerauschen durchsetzt. Die charakte- 
ristischen Frequenzstellen sind etwas micdriger cals z. B. ber dz: 
I. 1200-2400 Hz bzw. II. 1600-3200 Hz (Abb. 20: vigye! [vid'’j’e!] 
«tragen Sie es!»: d’ = 8 9,7’ = 5 9). 
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Die beiden Momente der Artikulation lassen sich auch hier 
deutlich voneinander abgrenzen. 
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Die oszillographischen Analysen zeigen also, daB die Affrikaten 
aus zwei zeitlich nacheinander folgenden Elementen bestehen und 
daB ihr erstes Element ein VerschluBlaut, das zweite ein homor- 
ganer Reibelaut, Engelaut ist. Anhand seiner Oszillogramme meint 
auch 7. Tarnéczy1, da® das zweite Element der ungarischen Affri- 
katen dem entsprechenden Engelaut gleichgesetzt werden kann, da 
ihre charakteristischen Frequenzstellen ibereinstimmen. Seinen 
Untersuchungen zufolge war z. B. die charakteristische Frequenz- 
stelle des isoliert gesprochenen Lautes sz (s) um 6800 Hz herum, 
das spirantische Element der Affrikate im Worte cz/u (tsilu) «Mieze» 
zeigte aber einen Wert um 7100 Hz herum. Die charakteristische 
Formantstelle des isoliert gesprochenen Lautes s (/) war 5260 Hz 
bzw. 5800 Hz, das spirantische Element des isolierten cs (t/) 
betrug 5200 Hz, 5350 Hz. und 6000 Hz. 

Meine Analysen haben also die Ergebnisse meiner fritheren mit 
dem Kymographion angestellten Forschungen bestatigt und stehen 
in vollem Einklang mit den Untersuchungen von B. Hala”, der 
anhand von Oszillogrammen, die er von tschechischen Affrikaten 
gemacht hatte, feststellte, daB bei den Affrikaten zwei Bildungs- 
momente: ein VerschluBelement und ein Engeelement zeitlich auf- 
einander folgen: «On peut aisément distinguer une partie occlusive 
et une autre fricative; les affriquées seraient donc formées... par 
deux éléments articulatoires successifs, Pun occlusif, autre spirant ou 
plus précisément ,constrictif‘3.» Auch das hat Hala ganz richtig 
erortert, daB der Verschlu8 bei Affrikaten etwas schwacher ist als 
bei VerschluBlauten und auch das Engeelement etwas unbestimm- 
ter ist als bei den echten Zisch- oder Reibelauten. Es ist also offen- 
bar, daB diese Momente hinsichtlich ihrer Bildung typische Re- 
duktionserscheinungen sind, wie es auch 7. Forchhammer nachdriick- 
lich betont hat: « Die Affrikaten kénnen somit als reduzierte Lalem- 
verbindungen bezeichnet werden‘. » 

Die bei der Bildung der Affrikaten zutage tretenden zwei Mo- 
mente kénnen tibrigens auch an Oszillogrammen von spanischer 
und italienischer Rede dhnlich beobachtet werden®, wie darauf 
auch bereits B. Hala hingewiesen hat. 

1 Tarnoczy, S. 328-329. 
* Hala, 8. 77-93. 
8 Hala, 8. 83. 


4 Forchhammer, 1953, S. 405. 


° Mme De Chaves, Problemas de fonética experimental. 1948, Fig. 56; Gemelli, Ta- 
feln XI, XV, XVI und XVII. 
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d) Mit automatischem Tonhohenschreiber gemachte Aufnahmen 
gewahren uns auch niitzliche Aufschliisse iber die Artikulations- 
momente der Affrikaten. Auf diesen Aufnahmen sind VerschluB- 
element und Engeelement deutlich abgegrenzt, denn wahrend 
der VerschluBbildung ist die Stille vollkommen (bei stimmlosen 
Lauten), wahrend der Engebildung entstehen aber Reibegerausche 
hoher Frequenz, die bei geeigneter Technik auch auf dem Ton- 
hohenbild Spuren hinterlassen. Auf Abbildung 21 sehen wir den 


Abb. 21 


Tonhohenverlauf des Wortes acél (atsel) «Stahl» in der Aussage- 
form (oben)!, und sein gleichzeitiges Oszillogramm (unten). Auf 
dem Tonhéhenbild beginnt die Darstellung mit dem Vokal d der 
ersten Silbe, und es weist gegen das Ende hin in den beiden letzteren 
Perioden langere Lichtstabchen auf. Hier gehen also die Stimm- 
bander aus der geschlossenen Stimmtonstellung in offene iiber. 
Wahrend fiinfhundertstel Sekunden zeigt das Tonhdhenbild nichts. 
Jetzt wird also das VerschluBelement der Affrikate ¢ (ts) gebildet. 
Danach erscheint eine Reihe von sehr kurzen Lichtstaébchen auf 
dem Bild. Dies ist das Zeichen dafiir, da das zweite, d.h. das 
Engeelement der Affrikate, ein Zischlaut von hoher Frequenz, ent- 
standen ist (s = 15 ~). Wir kénnen aber die zwei Phasen der Arti- 
kulation nicht nur am Tonhdhenbild, sondern auch am gleich- 
zeitigen Oszillogramm in deutlicher Form beobachten. Unten fallt 
die Amplitude des Vokals @ bei der Bildung des Verschlusses der 
Affrikate auf die 0-Linie herab, dann wird allmahlich die Amplitude 
der Gerdusche breiter und an der Grenze des Vokals ¢ (2) wieder 
schwacher. Es kannselbst mitfreiem Auge beobachtet werden, daf das 
Engemoment ungefahr das Dreifache des VerschluBelementes ist. Es 
ist also verstandlich, daB unser Gehérorgan jedes einzelne Artiku- 


1 Die kurzen Linien bezeichnen hohe musikalische Tone, die langeren tiefere. 
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Abb. 23 


Abb. 24 


lationsmoment wegen der hochgradigen Dauerreduktion des ersten 
Elementes nur dann auffassen kann, wenn die Dauer der Affrikate 
verlangert wird (z. B. ruccan) und das sonst reduzierte VerschluB- 
element in hohem Mabe verlangert wird. Ganz ahnlich verhalt es 
sich auch auf Abbildung 22, die das Wort a cél (a tsél) «das Ziel» 
darstellt. Wenn wir diese Worter mit solchen vergleichen, die den 
Zischlaut sz (s) enthalten, sehen wir, da die Bilder der Engelaute 
einander ahnlich sind und dafi nur an der Dauer einige Abwei- 
chung zu bemerken ist (Abb. 23: a szq [a saj] «der Mund», Abb. 
24: aszdly [asaj| «Diirre»). 

Ahnlich verhalt es sich auch auf Abbildung 25: mocsok (motSok) 
«Schmutz», 26: moccan (motsan) «sich rihren» und 27: Ziimmégés 
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hallatszik (ziimégéS halatsik) «ein Summen ist zu héren». Das 
letztere Teilstiick ist aus einer gr6Beren zusammenhangenden Rede- 
einheit herausgeschnitten, und so zeigt die lange Affrikate des 
Wortes hallatszik — infolge des gesteigerten Sprechtempos — an 
absolutem Dauerwert keine solche Grofe wie in isoliert gesproche- 
nen Wortern. 

Die zwei Phasen der Artikulation der Affrikaten kénnen nicht 
nur an Aufnahmen mit Mundmikrophon, sondern auch an solchen 
mit Kehlkopfmikrophon gesehen werden, trotzdem diese Zisch- 
gerdusche in solchen Fallen nicht unmittelbar registriert werden 
konnen, da diese ja im vorderen Teil der Mundhohle und nicht in 
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der Gegend der Kehle entstehen. Abbildung 28 zeigt das Registrat 
des Wortes kétség (két8ég) « Zweifel» mit langer Affrikate. Nach dem 
VerschluBelement bemerkt man wahrend der Bildung des Zisch- 
lautes auch Gerdusche von ganz niedriger Frequenz. Abbildung 29 
gibt den Tonverlauf und das Oszillogramm des Wortes bodza 
(bodza) « Holunder» wieder. Beim VerschluBelement der Affrikate 
fallt auch die musikalische Hohe des Tons allmahlich tiefer und 
erreicht ihre gréBte Tiefe wahrend der Artikulation des Enge- 
elementes. Das Verhaltnis der Dauer des VerschluBelements und des 
Engeelementes ist 1,6:1 (d = 16 9, z = 10 9). 

Wie oben bereits erwahnt, kann die Dauer der einzelnen Ele- 
mente der Affrikate reduziert sein. Aus den experimentalphoneti- 
schen Untersuchungen erhellt aber auch, daB oft auch die Stimm- 
lippentatigkeit im zweiten Element der stimmhaften Affrikaten eine 
gewisse Reduktion aufweist. Abbildung 30 zeigt die Frageform des 
Wortes bodza (bodza) «Holunder». Am unteren Oszillogramm 
konnen wir deutlich sehen, dai die Amplitude der von den Stimm- 
bandern erzeugten Wellen im zweiten Element der Affrikate sehr 
klein ist und der Laut gegen das Ende hin fast als stimmlos ange- 
sprochen werden kann. Daf es wirklich so ist, konnen wir auch am 
oberen Tonhéhenbild kontrollieren, wo die Kontinuitat der Licht- 
stabchen an mehreren Stellen aussetzt. In dieser Hinsicht sind auch 
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die Abbildung 31: maharadzsa (maharadza) «Maharadscha» und 
32: fogéddzik (fogddzik) «sich anhalten» sehr lehrreich; an ihren 
Oszillogrammen k6nnen wir die Reduktion der Stimmlippentatig- 
keit im zweiten Moment der Affrikate gut verfolgen. 

Es erhellt also auch aus Analysen mit dem automatischen Ton- 
hohenschreiber, das die Bildung der Affrikaten nicht einheitlich ist, also 
anders als die Artikulation anderer Konsonantengruppen (z. B. 
Engelaute oder VerschluBlaute) im allgemeinen. Die charakteristi- 
schen Momente der VerschluBlaute sowie der Engelaute sind in 
ihnen enthalten, aber meistens ist keines von ihnen vollkommen, da 
sie sich an Bildungsweise einander anpassen: die Stelle des Ver- 
schlusses wird ein wenig nach der Enge zu verlagert, der Verschluf 
hingegen wird nicht ganz gesprengt, nur bis zu der Stellung, die 
die Engebildung benétigt. AuBerdem wird — je nach den verschie- 
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denen Typen der Affrikaten — Dauer, Stimmlippentatigkeit, Mus- 
kelspannung oder irgendein anderes Artikulationsmoment des einen 
oder des anderen Elementes reduziert. Bei der Artikulation der 
kurzen Affrikaten vom Typ ¢ (ts) und cs (ts) ist die Reduktion des 
VerschluBelementes auffallend, das im allgemeinen nur die Halfte 
oder das Drittel der Dauer des Engeelementes ausmacht. Bei den 
Affrikaten vom Typ gy (d7’) und ty (t’z’) hingegen ist das Ver- 
schluBelement das ausgepragtere und das Engeelement das redu- 
ziertere. Die eigenartige Verbindung von VerschluB und Enge ist 
aber hier — wie wir es unter c) gesehen haben — ebenso charakte- 
ristisch wie bei anderen Typen. Dies wird iibrigens auch durch die 
Tatsache bewiesen, da wir das Engemoment nach der Sprengung 
des Verschlusses auch durch das Kehlkopfmikrophon gut verfolgen 
koénnen: Abb. 33: hattyi (hat’y’G) «Schwan», Abb. 34: ztatja 
(itat’y’A) «er trankt ihn». Bei diesen langen palatalisierten Affri- 
katen erreicht das Verhaltnis des Verschlusses und der Enge sogar 
die Proportion 3:1, wahrend sie bei den kurzen im allgemeinen 
kotsodernls3/gust: 


fs. mega 


u 
Trt togey q1blnbh | 


“orrrtyey pd | 


AuBer der Zweimomentigkeit bestatigen derartige Analysen 
noch eine andere wichtige Tatsache: VerschluB- und Engemomente 
Konnen voneinander abgegrenzt werden und folgen zeitlich nacheinander, sie 
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werden also nicht gleichzeitig gebildet?. Die Verkiindung des Prin- 
zips der Gleichzeitigkeit! widerspricht tibrigens selbst den einfach- 
sten Beobachtungen. Wie ware es zum Beispiel méglich, das Ele- 
ment ¢’ des ungarischen Wortes hattyi «Schwan» gleichzeitig mit 
dem spirantischen ,’ zu bilden, wenn das Gerausch nur nach Spren- 
gung des Verschlusses, nach Auflésung der groBen Beriihrungs- 
flache entstehen kann? 

e) Den zusammengesetzten Charakter der Artikulation der 
Affrikaten kénnen wir tibrigens auch an Aufnahmen, die mit dem 
Pegelschreiber von hoher Geschwindigkeit («High Speed Level 
Recorder») gemacht wurden, beobachten. Dieser moderne elektro- 
akustische Apparat registriert die wahrend der Bildung der Sprech- 
laute auftretenden Schalldruckschwankungen? und weist auf, daB 
bei der Bildung der Affrikaten der Schalldruck wahrend des Ver- 
schlusses herabsinkt, und selbst nach dem VerschluBmoment nicht 
plotzlich in die Hohe steigt wie bei den echten VerschluBlauten, 
sondern sich zwischen dem Druckniveau des Verschlusses (0-Linie) 
und des folgenden Vokals bewegt (Abb. 35: acél [atsél] «Stahl» 
und Abb. 36: a cél [a tsél] «das Ziel». Die Schalldruckkurve der 
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Abb. 35-36 


Affrikaten zeigt also die Verbindung der charakteristischen Druck- 
formen der VerschluBlaute und der Engelaute. Ahnliche Beobach- 
tungen haben diesbeziiglich auch J. Mahnken und M. Braun im 
Verlauf der Analysen von russischen Schalldruckaufnahmen ge- 
macht: « Die Affrikata c (ts) bildet im allgemeinen zwei selbstandige 
SDr-e tiber ¢- und iiber s-Element.» Unter dem Schalldruckbild 11 
steht die Erklarung: «Auflésung des ¢ in ¢+s», dann unter 12: 


1 Vel. Belgeri, Laziczius und andere. 
2 Hegediis, 1955, S. 181-214. 


2 Hegediis, Neuere Untersuchungen 


«Auflésung des é in t-+5"1.» Die beiden Momente der Schalldruck- 
kurven der Affrikaten zeigen ferner I. Fonagys Aufnahmen?. 

Aus dem Obigen konnen wir also ersehen, dafi die mit ver- 
schiedenen Forschungsmethoden erhaltenen Ergebnisse in vollem 
Einklang miteinander stehen und die Momente des Artikulations- 
verlaufes von verschiedenen Seiten her zeigen. Aus den vielseitigen 
Untersuchungen geht klar hervor, daB die Affrikaten in artikulatori- 
scher Hinsicht nicht einheitliche Laute sind, sondern einen zusammen- 
gesetzten Charakter haben. Sie werden gekennzeichnet durch ein Ver- 
schluBelement und ein homorganes Engeelement. Ja, wir konnen 
sogar sagen, da sie Verbindungen von VerschluBlauten und 
homorganen Engelauten darstellen, die sich hinsichtlich der Stelle 
und der Weise ihrer Bildung einander anpassen, infolgedessen das 
eine oder das andere Element — eventuell beide — an Dauer, Muskel- 
spannung, Stimmlippentatigkeit oder sonst etwas reduziert wer- 
deni: 

5. Bei unseren Untersuchungen miissen wir auch in Betracht 
ziehen, welchen akustischen Eindruck die Affrikaten im allgemeinen 
in den Hérenden erwecken. Aus den bisherigen Beitragen der Fach- 
literatur koénnen wir feststellen, daB die diesbeziiglichen Urteile 
sowohl der Phonetiker als auch der Laien von hochgradiger Un- 
sicherheit und Schwankung zeugen. Einige nehmen die Affrikaten 
akustisch als die Verbindung zweier Elemente wahr, also als 
t--S, t--5, d-pz, dz, U--y’, andere sprechen vou «germischter> 
Klangfarbe, andere wieder vom Eindruck einer «einheitlichen» 
Klangfarbe. Solche, die in ihrer Muttersprache keine Affrikate 
haben, beurteilen den akustischen Eindruck im allgemeinen als 
veranderlich, als nicht einheitlich und halten sie fiir die Verbindung 
zweier Laute. Solche aber, die selbst diese Laute gebrauchen, 
fassen sie oft als einheitliche Klangeindriicke auf. 

Um den akustischen Eindruck zu analysieren, hat P. Passy4 
das auf der Wachswalze des Phonographs aufgezeichnete spanische 
Wort ocho umgekehrt abgespielt und die Lautfolge oto gehort. Auf 


1 Mahnken und Braun, 8S. 291. 

2 Fonagy, S. 402, Tafeln 19, 20 und 21. 

* Auch Meyer und Gombocz (Zur Phonetik der ungarischen Sprache. Upsala, 1909, 
S. 54) halten die Affrikate ¢ (ts) fiir eine reduzierte Lautverbindung: «Man sieht, daB 
im allgemeinen die lésung des ¢-verschlusses zur tiberenge von einer reduktion der 
dauer begleitet ist», 7. Forchhammer aber schon alle Affrikaten: «die Affrikaten kén- 
nen... als reduzierte Lalemverbindungen bezeichnet werden» (Z. f. Phon. 7, 405, 1953p 

* Passy, P., Petite phonétique comparée. Leipzig/Berlin 1922. 
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Grund dessen hat er festgestellt, daB die Affrikate i akustisch nicht 
einheitlich ist, sondern genau aus zwei Elementen: t-+¥ besteht. 
Ahnliche Beobachtungen haben J. Soames! und E. H. Tuttle? bei 
englischen Affrikaten, E. Richier® bei italienischen Affrikaten ge- 
macht. £. Richter nahm die zu untersuchenden Worter und Satze 
nicht auf den Phonographen, sondern auf die Schallplatte auf, dann 
sie sechs Personen die umgekehrt abgespielte Aufnahme beobachten 
lieB und ihre Schalleindriicke aufzeichnen. Ihre prinzipielle An- 
nahme war, das beim umgekehrten Abspielen kein bekannter Wort- 
kérper die Beobachter beeinflussen kann, da die aufeinanderfolgenden 
Laute ihnen unbekannte Worter darstellen. Somit miBten die 
Affrikaten, wenn sie akustisch einheitliche Laute sind, auch um- 
gekehrt gespielt einheitlichen Eindruck auf die Zuhérer machen. 
Die Protokolle tiber die subjektive Wahrnehmung waren sehr lehr- 
reich, denn sie ergaben, da} die Beobachter die italienischen Affri- 
katen akustisch folgendermaBen wahrgenommen hatten: 1. als 
Verbindungen von zwei Lauten (sie notierten also z. B. S¢) wurden 
sie in 140 Fallen (59,6%) aufgefaBt, 2. als Engelaute in 52 Fallen 
(22,1%), 3. als VerschluBlaute in 39 Fallen (16,6%) und endlich 
4. als Affrikaten einheitlicher Klangfarbe nur in 4 Fallen (1,7%) 4. 
Es mutet uns sonderbar an, dali EF. Richter, trotzdem die Beobachter 
in der Mehrzahl der Falle die Affrikaten als Lautverbindungen be- 
urteilten (beinahe 60%!), die SchluBfolgerung von ihren Unter- 
suchungen zieht, da sie «einheitliche Laute» sind. Dieses Beispiel 
beweist auch, wie nachteilig die Vorurteile die wissenschaftlichen 
Arbeiten beeinflussen konnen. Die Vermengung des akustischen 
Gesichtspunktes mit dem phonematischen hat mit Fug J. Forch- 
hammers scharfe Kritik herausgefordert, wonach es dann offenbar 
wurde, da die zwei Gesichtspunkte nicht identisch sind und ein- 
ander auch nicht immer decken. 

Die Methode des Umgekehrtspielens habe ich auch bei der 
Untersuchung des akustischen Eindrucks der ungarischen Affri- 
katen angewendet. Ich nahm Worter, die lange und kurze Aftri- 
katen wie auch die Folge von VerschluBlaut und Engelaut ent- 
hielten, von 4 Versuchspersonen aufs Magnetophonband in Aus- 
sage- und Frageform auf, dann lief ich 10 wissenschaftlich gebildete 


1 Soames, S. 38. 

2 Tuttle, S. 326. 

3 Richter, S. 1-38. 

4 Forchhammer, 1941, S. 13. 
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Linguisten das umgekehrt abgespielte Material abhéren. Vom 
Zweck des Experiments hatten 7 Beobachter nichts gewuft, und 
so hielten sie die Worter fiir arabisch oder aus einer ihnen unbe- 
kannten Sprache stammend. Beim Umgekehrtspielen wird natirlich 
auch die Reihenfolge der Artikulation umgetauscht, und deshalb 
ist besonders die Beobachtung des Stimmeinsatzes und -absatzes 
(weich, gehaucht usw.) sehr lehrreich. Was wir in der gewohnlichen 
Rede gar nicht bemerken (z. B. die feine Behauchung nach Spren- 
gung des Verschlusses: fonnyad [fon’ad®] «welkt»), tritt hier scharf 
hervor. 

Die Beobachter hatten die Lautelemente folgender Worter beim 
umgekehrten Abspielen zu kontrollieren: cica (tsitsa) « Katzchen», 
capa (tsapa) «Hai», acat (atsat) «Kratzdistel», lé (lets) «Latte», 
Véc (vats) «Waizen» (Ortsname); csdp (t8ap) «Fihler», csacsi 
(t8at8i) «Eselchen», «Eselfohlen», rdcs (rat8) «Gitter», kacsa 
(kat84) «Ente»; dzsem (dzem) «Jam», findzsa (findza) «Tasse», 
ldndzsa (landza) « Lanze»; brindza «eine Art Schafkase» ; gydr (d’j’ar) 
«Fabrik», gyep (d’j’ep) «Rasen», dgyam (ad’j‘am) «mein Bett», 
vagy (vad’j’) «Sehnsucht», ddgy (lad’j’) «weich»; ¢tyuk (t’y’tk) 
« Henne», atydm (at’y’am) «mein Vater», bdtydm (bat’y’am) «mein 
alterer Bruder», Véty (vat'y’) (Ortsname); Ozd (Ortsname), ézdi 
«von Ozd», ezsdi (ezdi) «er fleht», Pistt «Steff» (Kurzform von 
Stefan), dztat (astat) «er weicht ein»; fonnyad (fon’ad) «es welkt»; 
bodza «Holunder»; maharadzsa (maharadza) «Maharadscha»; 
megbuggyan (megbud’j’an) «es blubbert»; Jepottyan (lepot’y’an) «er 
plumpst herunter»; biccen (bitsen) «er tut eine kleine wackelnde 
Bewegung». 

Die Beobachter beurteilten zu 100%, also ganz einstimmig, die 
Affrikaten als die Verbindungen von zwei Lauten. Sie nahmen an 
der Stelle des umgekehrt gespielten ¢ (ts) — szt— (st -) Laute wahr 
(cica — asztiszt, capa — apdszt, acat — taszta, Vac — sztav usw.; 
biccen — neszt’ib, racs — star, kacsa — »astak), an der Stelle des dz 
ein zd (brindza — azdnirb, bodza — azdob, "azdob, azdob), an der 
Stelle des dzs (dz) ein zsd (2d) (dzsem — mezsd, findza — azsdnif, 
landzsa — azsdnal, maharadzsa~—azsdaraham, "azsdaraham, azsd‘a- 
raham), an der Stelle des ty ein x’ (bzw. j) ¢ (tyak — kujt, lepottyan 
— najty’opel, najy’topel, nastyopel, najy’t’opel), an der Stelle des 
gy (d’j’) ein y’d (gyar — rajd, gyep — djep, Djep, 4gyam — majda, 
vagy — jd [n?] av, lagy — jdal, jnal, jnyal; megbuggyan — najy’ 
dubgem, nazsdubgem, najz’d’ubgem). Umgekehrt geben also die 


liber die ungarischen Affrikaten 175 


akustischen Elemente genau dieselbe Zweigliedrigkeit wieder wie 
auch die Artikulation selbst. Es ist also zweifellos, daB wir die un- 
garischen Affrikaten in akustischer Hinsicht nicht einheitlich nen- 
nen kénnen; es ist aber auch natiirlich, daB der akustische Eindruck 
nicht bei allen Affrikaten gleich ist. Einen verhaltnismaBig mehr 
verschmolzenen Klangeindruck machen auf die Zuhorer c (ts) und 
cs (t8) wie auch dy (t’z’) und gy (d’j’). Der Grund hierfiir liegt darin, 
da bei ihrer Bildung das VerschluB- bzw. das Engeelement in 
hohem Grade reduziert ist, auBerdem ist die tatsichliche Lautung 
akustisch hauptsachlich durch das zweite, d.h. das Gerausch- 
element vertreten. So gibt bei ¢ (ts) und cs (t8) das Zischgerausch, 
bei ty (t’x’) das Reibegerausch den typischen Lautungscharakter an. 
Anders verhalt es sich akustisch bei den Affrikaten dz und dzs (dz). 
Die Klangfarbe dieser Laute empfindet man als am wenigsten ein- 
heitlich, ja die meisten Zuhérer nehmen sie entschieden als Laut- 
verbindungen wahr. Und das hat wirklich seinen guten Grund. 
Bei der Bildung dieser Laute ist das VerschluBelement nicht 
stumm, sondern stimmhaft, und es stellt eine ganz andere Klang- 
farbe dar als das folgende stimmhafte Engeelement. Die Stimm- 
haftigkeit und die Zischgerausche von hoher Frequenz beim zwei- 
ten Element machen diese Affrikaten fast zweigliedrig. Beim um- 
gekehrten Abspielen wird diese Lautverbindung véllig wahrnehm- 
bar. AuBerdem habe ich mit einer Gegenprobe bestatigt, da die 
Verbindung von zwei Lauten das Wesen dieser Affrikaten aus- 
macht. In den auf Magnetophonband aufgenommenen Wortern 
Ozd, 6zdi und ezsdi haben bei umgekehrtem Abspielen alle Beob- 
achter dz bzw. dzs (dz) als Affrikaten wahrgenommen: dzé, idz6, 
idzse. Auf diese Weise ist es verstandlich geworden, warum dz und 
dzs (dz) besonders viel Unsicherheit hervorrufen und warum sie 
auch den Fachleuten der Rechtschreibung in Ungarn so viel Kopf- 
zerbrechen machen. 

Die subjektive akustische Untersuchung der Affrikaten hat also 
ergeben, da diese hinsichtlich der Klangfarbe nicht einheitlich 
sind und einen gewissen Spielraum zulassen. Bei stimmlosen ‘Typen 
wird die Stummheit des Verschlusses von Zisch- und Reibegerau- 
schen beinahe unterdriickt, und darum wirken sie etwas einheit- 
licher (c, cs, ty). Die stimmhaften aber — besonders dz und dzs 
(dz) — erwecken entschieden den Eindruck der Zweiglicdrigkeit in 
den Zuhérern. Das umgekehrte Abspielen der Affrikaten zeigt, 
daB simtliche ungarischen Affrikaten in der Tat reduzierte Laut- 
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verbindungen sind, sie konnen aber einen einheitlicheren oder einen 
weniger einheitlichen Klangfarbeneindruck deshalb erwecken, weil 
die Gerauschelemente bei den Stimmlosen das stumme VerschluB- 
element unterdriicken konnen und auf diese Weise wahrnehmungs- 
psychologisch das Ubergewicht erlangen. 

6. Den Phonemwert der Affrikaten pflegt man auf Grund des 
«Sprachgebrauchs», des Urteils der «Sprachgemeinschaft», des 
«SprachbewuBtseins» zu bestimmen. Die Meinung der Forscher 
ist auch hinsichtlich der phonematischen Wertung sehr geteilt. 
Einige fassen die Affrikaten als Einzellaute, andere als zusammen- 
gesetzte Laute bzw. Lautverbindungen auf. Bei uns schreiben sie ihnen 
im allgemeinen monophonematischen Wert zu. Wenn wir aber 
etwas naher auf ihre Analyse eingehen, so sehen wir, daB es gar 
keine einfache Aufgabe ist, dies zu entscheiden. Dies geht auch aus 
den folgenden Zeilen von Laziczius! hervor: «Ob etwas ein ein- 
heitlicher Laut oder eine Lautverbindung ist, das ist — nach unserer 
Meinung — in erster Linie und hauptsachlich eine sprachliche Frage, 
die zu entscheiden nur mit Beachtung der in Frage kommenden 
sprachlichen Verhaltnisse moglich ist. Die Tatsache selbst, daB die 
ungarische Sprache im Anlaut der Worter die Affrikaten duldet, 
obwohl sie sonst alle Konsonantenverbindungen aufzuldésen oder zu 
vereinfachen sucht, zeigt, daB im Ungarischen die Affrikaten un- 
bedingt Einzellaute sind.» Es ist klar, daB die Bestimmung der «in 
Frage kommenden sprachlichen Verhaltnisse» keine leichte Auf- 
gabe ist. Selbst Laziczius unternimmt nicht, diese zu bezeichnen, 
und spricht blo8 von der Auflosung der Konsonantenhaufungen im 
Anlaut, was an sich kaum als iiberzeugender Beweis angenommen 
werden kann. 

Trubetzkoy? schreibt uber die einschlagige monophonematische 
Wertung, daB solche Lautverbindungen dann den Wert eines Pho- 
nems haben, wenn (I) ihre Elemente in der betreffenden Sprache 
nicht in zwei Silben auftreten konnen, wenn (II) sie durch einheit- 
liche Artikulationsbewegungen hervorgebracht werden und wenn 
(III) wberdies ihre Dauer die normale Dauer der Einzellaute nicht 
ubersteigt. 

Nach Trubetzkoys Definition ist also der monophonematische 
Wert der ungarischen Affrikaten sehr unsicher, denn: (I) ihre 


1 Laziczius, 1944, S. 80. 
2 Trubetzkoy, S. 50. 
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Elemente kénnen manchmal in zwei Silben kommen}, (II) ihre 
Artikulation hat zwei Momente und (III) endlich, ihre Dauer iiber- 
steigt den normalen Dauerwert der Einzellaute. Auf diese letztere 
Tatsache hatte ich schon wahrend der ungarischen Affrikaten- 
debatte hingewiesen und auf Grund von Messungen erwiesen, daB 
die Dauer der Affrikaten im allgemeinen etwas langer ist als die der 
anderen Gruppen von Konsonanten. Ubrigens haben auch Meyer 
und Gombocz? mit Messungen bestatigt, daB die Dauer der Affri- 
katen bedeutend langer ist als die der VerschluBlaute und Enge- 
laute und manchmal sogar das Doppelte der der Einzellaute aus- 
macht: «Im besonderen ist die Gesamtdauer des ¢s in tdts und tats, 
ca. 22. h.s., keineswegs gleich der Dauer eines einfachen Konso- 
nanten, wie das nach Balassa... der Fall sein soll, sondern betragt 
ungefahr das Doppelte derselben?. » 

Seitdem haben neuere Untersuchungen und Dauermessungen 
diese These bestatigt. Die Durchschnittswerte der hier vorgefiihrten 
Affrikaten sind die folgenden: 1. ¢ (ts) = 19,8  (t-Element = 
6,17 ¢, s-Element = 13,7 ¢), 2. ce (ts) = 30,7 @ (t: 11,9 9, s: 18,8 9), 
SACS ES ue = 110,209 (ts: 08 esa 162g) 4 cosa 18) i926, Ju (ts 12 Shap, 
5: 14 9), 5. &y (t’x') = 18 @ (t’: 10,5 9, x’: 7,5 ¢), 6. tty (t’x’) = 30,8 
(RS ag. ty Ge) efdze 115, Dona 5ozt110)59)5. 8xdze= Qo 
(G15) oy Z210-9),09. des (dZ)-=.11,7 9 (d: 5 93:2: 6,7 y), 10-dzs 
(Aza LO, Sr pnt 81255 g, '7:073%0)5 Wag dj) 13°) (8295 
j\3).¢). 

Nach meinen Dauermessungen, die ich im Dorfe Jagonak (im 
Komitat Baranya) mit Schallplatten vorgenommen habe’, betragt 
zum Beispiel die Durchschnittsdauer des ¢ 8 ¢, des d 69, des 5 79, 
des s 10 y und des z 6 9; gy (d’j’) = 6,75 9, ty (t’x’) = 7,5 9, cs (t8) = 
14,2 9. 

Die Daueranalyse der Sendung des ungarischen Rundfunks® 
hat ergeben: t = 7,79, s (8) = 8,6 9, sz (s) = 10 g3 ¢ (ts) = 13,3 
und cs (t8) = 12 y. Auf Grund der Daueranalyse der Vorlesung 
« Kéltéznek a madarak» (Die Vogel ziehen fort) im ungarischen 


1 «A magyar helyesirds szabalyai.» — Regeln der ungarischen Rechtschreibung. 
Budapest, 1954, § 321: ed-zitek «ihr hartet ihn ab», madzag «Bindfaden», ped-zi «er 
bei®t an», lopéd-zik «er schleicht»; hod-zsa «Hodscha», maharad-zsa « Maharadscha» 
usw. 
2 Meyer und Gombocz, S. 54-55. 

Bi Gy Osis ooh 
4 Hegediis, 1941, S. 10-15. 
5 Leitartikel der Zeitung «Szabad Nép» vom 24. November 1954. 


178 Hegediis, Neuere Untersuchungen 


Rundfunk ist t = 6 9, s (8) = 10 9, sz (s) = 10 9, ¢ (ts) = 13 @ 
und cs (t8) = 16 9. 

Chlumsk} und. Hdla haben fir die tschechischen Affrikaten ge- 
funden, daB zum Beispiel die durchschnittliche Dauer von ¢ und ¢ 
langer ist als die des VerschluBlautes ¢ und dem Mittelwert von s 
und s nahe kommt oder ihm gleich ist. Nach O. von Essen? ist die 
Zeitdauer der deutschen Affrikaten auch langer als der Mittelwert 
anderer Lautgruppen. 

Aus dem Gesagten geht also klar hervor, daB es im Grunde 
genommen nicht leicht ist, den Phonemwert der Affrikaten zu be- 
stimmen. Es erwachsen viele Unsicherheiten daraus, daB ihre 
Elemente manchmal zu zwei Silben geh6ren konnen (bei den langen 
Varianten immer), da sie zwei Artikulationsmomente aufweisen 
und daB sie hinsichtlich der Dauer eine eigenartige Stellung ein- 
nehmen. 

D. Fones reiht in seinem Werk «The Phoneme: Its Nature and 
Use» die Affrikaten in eine besondere Kategorie ein. Er sagt, man 
konne drei Gruppen von Sprachlauten unterscheiden: a) einfache 
Laute («simple sounds»), wie zum Beispiel m, n, l, f, z und die 
Vokale, b) Gleitlaute («gliding sounds»), zum Beispiel w und J, 
und endlich c) zusammengesetzte Laute («compound sounds»), 
deren Hauptvertreter die Affrikaten waren. Das Hauptcharakte- 
ristikum dieser letzten Gruppe sei auch in artikulatorischer Hinsicht 
die Zusammengesetztheit: «An affricate has a ‘stop’ and a ‘plo- 
sion’ which terminates with friction reminiscent of the correspond- 
ing fricative consonant?. » 

Unseres Erachtens ist ein groBer Teil der ungarischen Affrikaten 
(c, cs, gy, ty) auch trotz ihrer physiologischen und akustischen Zu- 
sammengesetztheit als monophonematisch zu bewerten, die Stel- 
lung ihrer kleineren Gruppe (dz, dzs) ist aber tiberaus zweifelhaft. 
Bildung, akustischer Eindruck und Dauerverhaltnisse dieser Laute 
liegen an der Grenzlinie; deshalb ergeben sie nicht nur in unserer 
Rechtschreibung Probleme, sie haben sogar im Laufe der Sprach- 
geschichte Unsicherheit hervorgerufen und Lautwandel zur Folge 
gehabt. Hierauf deutet die Tatsache, daB ihre Elemente als selb- 
standige Laute auch Formen mit Lautumstellung erzeugt haben. 


WHdlay Sao: 
2 vy, Essen, S. 94. 
3 Fones, S. 4-5. 
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L. Deme’ fiihrt zahlreiche Beispiele an, aus denen er folgende 
SchluBfolgerung zieht: «Die Affrikate dz... tritt in gewissen Fallen 
mit Lautumstellung als zd auf, sie kann also kaum ¢in Laut sein.» 

7. Die phonetische Bezeichnung der Affrikaten zeugt ebenfalls 
von groBer Unsicherheit und auffallender Schwankung. Szende 
Riedl? (Mansuet) schlieBt sie aus der Gruppe der «einfachen» 
aus, er nennt sie «Mischkonsonanten», und dementsprechend meint 
er, daB gy durch die Buchstabenfolge d+ j (7), ty durch t+; (i), ¢ 
durch ¢+-sz, cs durch ¢-+s und endlich ds durch d+s wiedergegeben 
werden sollen. 7. Balassa faBt die Affrikaten als Diphthonge auf 
und empfiehlt folgende Buchstaben zu ihrer Bezeichnung: cs = ts, 
ds = dz (a. a. O. 93-94), c= #5, dz = d4, cs = t8, dzs = di3, 
G. Bérczi* meint, einzelne Zeichen der alten finnisch-ugrischen Um- 
schrift seien grundsatzmabiger, also: c, 3, ¢, Z. E. Setdld® hat in der 
finnisch-ugrischen phonetischen Transkription folgendes: ¢ = t-++s, 
€ = ?t’+ oder t+5, 3 =d+z oder d+s. Im System der APhI 
diirfen Affrikaten mit zwei, aber auch mit einem Buchstaben be- 
zeichnet werden: «Affricates may be represented either by single 
lettres or by digraphs; sometimes one method is more convenient 
and sometimes the other®.» D. Fones meint, zur Wiedergabe engli- 
scher oder deutscher Affrikaten seien Doppelbuchstaben zu emp- 
fehlen, zur Bezeichnung der Affrikaten tiirkischer und indischer 
Sprachen aber eher Einzelbuchstaben. EF. Richter? gibt die italieni- 
schen Affrikaten phonetisch mit zwei Buchstaben wieder und be- 
zeichnet das an Dauer reduzierte Element mit einem kleineren 
Buchstaben: ‘/. Ahnlich gebraucht 7. Forchhammer zwei Buchstaben, 
und bei Affrikaten verbindet er die Buchstaben mit einem Bogen, 
wahrend er bei gewohnlichen Lautverbindungen den Bogen fort- 
1aBt (z. B. ts = Affrikate; ts = Verbindung zeitlich aufeinander- 
folgender Konsonanten). Dagegen schreibt B. Hala: «Il est pré- 
férable de les marquer, dans la transcription phonétique, par des 
signes simples, en accord avec leur caractére d’unité articulatoire 
et acoustique®.» Und seine Affrikatenzeichen sind: ¢, 3, ¢, Z 


1 Deme, S. 16. 

2 Riedl, Magyar Hangtan. 
3 Balassa, S. 130. 

4 Barczi, 8. 28. 

5 Setalad, S. 34. 

6 Fones, S. 5. 

7 Richter, S. 23-38. 

8 Hala, S. 93. 

1 7d.: 8. 94. 
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Da die phonetische Schrift die phonetische Natur der Sprach- 
laute widerspiegeln soll, sind wir der Meinung, da wir die Affri- 
katen unbedingt mit zwei Buchstaben wiederzugeben haben. Dies 
allein kann die zwei Momente der Artikulation richtig wider- 
spiegeln. 


Kusammenfassung 


Hinsichtlich der Beurteilung der Affrikaten herrscht im allge- 
meinen ein Durcheinander in der phonetischen Fachliteratur. Die 
einander widersprechenden Meinungen haben tiberall in der Welt 
manche Debatten entfesselt. Einige fassen die Affrikate als einen 
einzelnen Laut auf, andere wieder als die Verbindung zweier Laute. 
Einige Forscher teilen sie der Gruppe der VerschluBlaute, andere 
der der Reibelaute, andere hingegen einer gesonderten Gruppe der 
zusammengesetzten Laute zu. Die Gesichtspunkte der physiologi- 
schen, akustischen und phonematischen Bewertung halt man im 
allgemeinen nicht auseinander, sondern man vermengt sie mit- 
einander. Der Verfasser hat diese Gesichtspunkte einzeln hergenom- 
men und auf dieser Grundlage die Momente des Verlaufs der Arti- 
kulation an Palatogrammen, Oszillogrammen, an mit automatischen 
Tonhohenschreibern gemachten Bildern studiert; er hat an normal 
bzw. riickwarts gespielten Magnetophonaufnahmen den auf die Zu- 
hérer gemachten akustischen Eindruck untersucht und endlich sich mit 
der phonematischen Bewertung und der phonetischen Umschrift der un- 
garischen Affrikaten befaBt. 

1. Palatogramme ungarischer Affrikaten lassen erkennen, daB 
die VerschluBbildung ein wichtiges Moment der Artikulation ist. 
Die Ausbreitung der Beriithrungsflache von Zunge und Gaumen ist 
je nach Affrikatentypen und der effektiven Zeitdauer verschieden. 
Am kleinsten ist sie bei dz und ts, gréBer bei d% und tf, und am 
groBten ist sie in der palatalisierten Gruppe (d‘j’, tz’). 

2. Die von den Affrikaten gefertigten Kymogramme, Oszillo- 
gramme, Tonhdhenbilder und Schalldruckbilder zeigen, da8 von 
einer gleichzeitigen Artikulation der Elemente der Affrikaten kaum 
die Rede sein kann. Zuerst entfaltet sich das Bild des VerschluB- 
elementes und erst dann das des Engeelementes, die beiden kénnen 
voneinander abgegrenzt werden. Die Zeitdauerverhiltnisse der 
Affrikatenelemente, die Dauerreduktion der Elemente sind je nach 
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den Typen verschieden. Bei den Typen ts, dz, t¥, d¥ wird eher die 
Zeitdauer des Verschlusses (in der kurzen Form), in der palatali- 
sierten Gruppe (d’j’, d'y’) hingegen das spirantische Element redu- 
ziert. Aber es kann nicht nur die Zeitdauer der Elemente, sondern 
auch die Stimmlippentatigkeit, die Muskelspannung oder aber auch 
irgendein anderes Artikulationsmoment reduziert werden. 

3. Auf Grund von umgekehrt gespielten Magnetophonaufnah- 
men haben die Zuhérer die Affrikaten ausnahmslos als Verbin- 
dungen von zwei Lauten beurteilt, wahrend sie diese bei normalem 
Abspielen als Einzellaute beurteilten (Meinungsverschiedenheiten 
kamen nur bei den Affrikaten dz und dz vor). 

Der Verfasser ist der Meinung, da8 ein groBer Teil der un- 
garischen Affrikaten trotz ihrer artikulatorischen und akustischen 
Zusammengesetztheit einen monophonematischen Wert zu haben 
scheint — obwohl die monophonematische Bewertung keine ge- 
nauen und sicheren Kriterien hat -, da sie sich auch im Laufe der 
Sprachgeschichte als Einzellaute benommen haben. Nur die Stel- 
lung der Laute dz und dz beurteilt er als problematisch, da diese 
auch heute noch den Eindruck auf die Zuh6rer machen, am meisten 
Lautverbindungen zu sein, und da deren Elemente im Verlaufe der 
ungarischen Sprachgeschichte oft umgetauscht wurden und dies 
darauf hindeutet, daB die Sprecher sie im allgemeinen als die Ver- 
bindung von zwei Lauten empfanden. 

4. Zur phonetischen Bezeichnung der Affrikaten schlagt der 
Verfasser vor, auch weiterhin zwei Buchstaben zu verwenden, um 
den Charakter der Elemente auszudriicken. Diese Weise spiegelt 
namlich am treuesten die Zweiteiligkeit des Verlaufs der Artiku- 
lation, die wirklichen Bildungsmomente wider. Ohne Zweifel soll 
die phonetische Bezeichnung nicht die phonematische Wertung, 
sondern die Feinheiten der Lautbildung wiedergeben. 


Summary 


The phonetic literature displays a general confusion concerning the evaluation 
of affricates. Contradictory opinions have set off many controversies all over the world. 
Some writers rate the affricate as a single sound, others as a combination of two sounds. 
Some allocate them to the stops, others to the fricatives, and still others to a separate 
category of compound sounds. As a rule the different levels of analysis — physiological, 
acoustic, phonemic — are not kept separate, but rather confused with each other. The 
author has taken these levels one by one and on this basis has studied the factors contri- 
buting to the articulation through palatograms, oscillograms and pitch-meter traces; he 
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has investigated the acoustic impression on the hearer by means of tape-recordings played 
both forwards and backwards, and lastly he has concerned himself with the phonemic 
interpretation and the phonetic transcription of the Hungarian affricates. 


Résumé 


En ce qui concerne les affriquées, la confusion régne dans la littérature phonétique 
technique. Les opinions les plus contradictoires ont déchainé bien des débats de par le 
monde. Certains considérent les affriquées comme un son unique, d’autres comme la 
combinaison de deux sons. Certains chercheurs les rattachent au groupe des occlusives, 
d’autres a celui des fricatives, d’autres encore 4 un groupe séparé de sons complexes. 
Généralement, on ne sépare pas les points de vue physiologique, acoustique et phoné- 
matique, mais on les confond tous. L’auteur s’est placé a chacun de ces points de vue 
séparément et, sur ces bases, il a étudié les phases de l’articulation a l’aide de palato- 
grammes, d’oscillogrammes, de graphiques faits avec des enregistreurs de mélodie 
automatiques; il a étudié limpression acoustique produite sur l’auditeur avec des 
bandes de magnétophone jouées normalement et a l’envers et finalement il s’est occupé 
de l’évaluation phonématique et de la transcription phonétique des affriquées hon- 
groises. 
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The “th-Sounds” and Genetics 


By ROBERT WALLACE THOMPSON, Hong Kong 


Some time ago I published some observations** on the para- 
graphs dealing with the genetic component of language in The Elements of 
Genetics? by C. D. Darlington and K. Mather. 1 attempted to show, in 
very general terms, that they were wrong de jure, and, in rather more 
detail, that they were quite wrong de facto*. For example, in one 
of the areas (Ireland) with a very high frequency (70-75 %) of blood 
group O, they claimed that the voiced and voiceless dental fricatives 
are common*™*., It is indeed probable that the use of these sounds is 
restricted to the North East corner: and the popular belief that 
“‘th-sounds” are common in Ireland is partly due to attempts by 
writers (such as Somerville and Ross) to represent in conventional 
spelling sounds unknown to Standard English. In the same context, 
I also pointed out that soundshifts, apparently unrelated to any 
demonstrable alterations in the racial composition of the Greeks, 
had taken place in Greek. Finally, I showed that in the speech of 
Jamaicans *?*** of African, European and mixed stock, phonetic 
preference of both the individual and the group depends on cultural 
rather than racial background. 


* Lancelot Hogben, “Human Biology and Human Speech”’, British Journal of pre- 
ventive and social Medicine /0: 63-74 (1956), attacks their methodology from the 
biologist’s stand-point and reaches fundamentally the same conclusions as those of this 
paper. 

** T am aware that Darlington and Mather are led indirectly to the conclusion that 
there is a biological factor in the development of language by what they believe to be 
the coincidence of their two maps. I do not, of course, believe they think blood group O 
has any immediate connection with the ability of individuals to utter th-sounds! 

*** Rens, speaking of the Chinese of Surinam, says that ‘“‘the second generation born 
and bred in Surinam, speaks both Dutch and NE normally, without a trace of foreign, 
that is, non-Surinam, accent’. 
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In this paper I shall first deal with other errors in a map (p. 263) 
which Darlington and Mather exhibit. Afterwards I shall consider 
their categorical statement (p. 361) that “‘the fricative dental has 
arisen only in the Eurasian region’. I shall then try to set out briefly 
a more acceptable explanation of linguistic substratum in accordance 
with what I believe to be views held by many other modern students 
of language. 


1. Some Minor Factual Errors 


The following preliminary comments refer to the Map shown 
on page 363: 
(i) A 6-sound existed in earlier Finnish and exists in various Finnish 
dialects today 19* ; 
(ii) a 6-sound also existed in proto-Hungarian ?3; 
(11) dental fricatives occur in at least three Altaic!® languages — 
Balkar, Shors (6) and Bashkir (spoken in the Bashkir Autonomous 
Republic) where @ is the medial allophone of phoneme /c/ and 6 the 
final. 


2. 8/6 Outside Eurasia 


There is no doubt that the sounds @ and 6 are comparatively 
rare among the languages of the world. Nevertheless, we have al- 
ready seen that they are not quite so rare in the Eurasian region as 
Darlington and Mather indicate. Beyond this vast region, Africa? is 
the one area where it is largely true (in their words) that “the 
fricative dental has arisen only in the Eurasian region’’. In that 
continent, the dental fricatives do not appear in general, save in the 
Semitic !! ** languages or in regions under their influence. However, 
they have been recorded in some dialects !°. 

The dental fricatives also occur in the Melanesian language Lifu 
15, p. 680, while 6 occurs in the Melanesian languages Malu* and 
Tangoa 15, p. 677. Aleut®, a language related to the Eskimo cluster, 
has both the voiced and the voiceless dental fricatives. 

Though the presence or absence of these sounds in Amerindian 
languages is highly variable, we have good reason to believe that 
their blood group distributions were remarkably uniform before the 

* I am grateful to Professor Alan S. C. Ross of Birmingham University for information 
about the dental fricatives in the Finno-Ugrian group and for a number of points on 


their situation outside the Eurasian land-mass. Prof. Ross is not responsible for my 


interpretation of the facts. 
** In the Arabic of Syria and Egypt 0 / 6 are usually replaced by other consonants, 
but in Iraq they are more commonly retained. 
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coming of the Europeans?” *. dis present in Yuma (1° p. 1185), Chippe- 
wayan (1% p. 1180), Otomi (1% p. 1186) Osage 4 (spoken in Pawhuska, 
Okla.). Both are absent from the Carib’ group, Tonkawa (Texas) *, 
Quileute (N.W.Washington), Yuchi (Central Okla.), Zuni (W. New 
Mexico), Coeur d’Alene (N.Idaho), Kiowa® (spoken in 1918 at 
Anadarko, Okla. but formerly in what is now W. Montana). We 
may thus come to the conclusion that the concentration of group O 
and an inborn facility for the pronounciation of the th-sounds re- 
ceives no more compelling support from the study of American In- 
dians than from the speech habits of other peoples. It would be 
interesting to hear Darlington and Mather’s views on Lehmann’s s — 
z-sounds?2, which lie very close to 0 — 6, as for instance in Guatuso 
and Chilanga. Of s — z in Guatuso, Lehmann says (p. 380): “Dem 
Guatuso eigentiimlich sind gewisse gelispelte Laute, wie sie etwa in unserer 
Kindersprache vorkommen.” Of Chilanga he says (p. 700) : ‘Ein gelispelter 
Kischlaut ahnlich wie im Guatuso ist s, stimmhaft z.” 

Though by no means common sounds in the languages of the 
world, 6/6 do occur very widely, and, I believe, spontaneously in a 
great many language groups and among many peoples; but there is 
no evidence to show that individuals able to pronounce them — in 
Europe or elsewhere — are mainly of blood group O. 


3. Genetics and Linguistic Substratum 


In short, the isogens for the O iso-agglutinogen do not closely 
coincide with isophons for the dental fricatives 6/6 in Europe. It 
seems unlikely that they do so in the greater Eurasian land-mass; 
and if the “th-sounds” do occur in aboriginal America — a predomi- 
nantly O-continent — they do so sporadically. Ability to pronounce 
them cannot be proved to be of genetic origin. 

Let us now consider the question more generally, from the point 
of view of substratum. By substratum one implies survival of lexical or 
phonetic elements of a language in one which has superseded it. Such 
a substratum emerges slowly or otherwise where a whole population, 
at first bilingual, progressively gives up the old for the new. An entire 


first generation will then carry over its current speech habits into the 

* ...“the Indians of South and Central America who even now are almost entirely 
of group O may have been exclusively so before the coming of the Europeans.” For more 
details on this subject, see Chap. XIII. Mr. Douglas Taylor from Magua, Dominica, tells 
me that a “number of Amerindian tribes with 90% or more O group have either or 
both the th-sounds, not only gua sounds, but as phonemes’’. 


Thompson, The “th-Sounds’’ and Genetics 187 


use of the new language, together with some words describing specific 
phenomena for which it caters inadequately. It is likely that the 
speakers will also modify the grammar of the new language. In their 
own lifetime they will speak a pidginized form of it. 

To a greater or less extent, the phonetic system of the new 
language as later generations will speak it will retain features trans- 
mitted to the second generation by their mothers from whose mouths 
their children learn to utter its sounds. The formative role of the 
mother and of the old folk in this process has no necessary connexion 
with their genes. How drastic and how lasting its influence will prove 
must depend on circumstances incident to the transition. It may 
happen that native speakers of a newly imposed language may be 
warriors who marry the women-folk of the conquered speech com- 
munity. Likewise, it may happen that the conquerors bring in their 
own women folk, and thus maintain continuity with the pre-existing 
standard of the new tongue. 

In this way the raw African of the XVII or XVIIIth century 
handed down certain speech habits to the West Indians of today. 
In my earlier article, I indicated that the alleged inability of the 
Jamaican negro (and poor white) to pronounce the dental fricatives 
which he replaces by the corresponding voiced and voiceless alveolar 
alveolar d/ tis attributable to cultural circumstances to which genetics 
has no relevance. He says dis, dat, tink, etc. (this, that, think, etc.) be- 
cause his father (one should rather say mother) did so before him. The 
so-called Africanisms of his speech came down to him through ge- 
nerations of contact with such speech. There is no call to invoke 
genetic predisposition either to conserve or to reproduce them by a 
process of delayed action. 

It has been shown that slavery in the Spanish and Portuguese 
colonies was more paternal, more human (but not necessarily more 
humane) than in the English or Dutch®. A deliberate attempt was 
made to meet the spiritual needs of the slaves and some fundamental 
education was given by the clergy. In addition, a more serious effort 
was made by the Spaniards and Portuguese to plant their New World 
territories with peasants of European stock. As a result, their subjects 
of African descent did not greatly overwhelm in numbers those who 
spoke a European language in conformity with native usage, as 
happened in the English, French and Dutch colonies of the West 
Indies. Today there is no Spanish creole dialect in the New World, 
where the negroes of Cuba, of the Dominican Republic and of Porto 


188 Thompson, The “‘th-Sounds’’ and Genetics 


Rico pronounce the voiced dental fricative 6 every bit as well as 
their white or mulatto compatriots. The bozal or “raw” negro may 
have spoken a jargon. His children lost all the old speech habits in 
contact with both whites and blacks who spoke “‘normal” Spanish. 

In the last fifty years a relevant phonetic process has been going 
on in Papiamento, the creolized Portuguese of Curagao**. Here the 
medial consonants b — d — g are gradually being replaced by their 
fricative variants 6 — 6— y. This gradual sound-shift coincides with 
contact with Spanish. The latter has conferred prestige in business 
and social intercourse for over a century, during which it has pro- 
vided up to 85% of the contemporary vocabulary. This is part of a 
general process of decreolization, under the influence of Spanish, but 
we have no indications of any substantial genetic modification of the 
largely African population during the same period. Similar social 
forces impell the Hong Kong civil servant to straighten out his 
r-sounds, and the Yorkshire-born subaltern his 0 and uw sounds. Such 
forces affect both individuals and communities. 

Among linguists it was some years ago the fashion to speak of 
disappearance of certain sounds used by a community and their 
subsequent reappearance centuries later as the deferred action of the 
substratum, interpreted by some scholars in terms of the profound action 
of hereditary tendencies (A. Meillet, Bull. Soc. Ling., Paris 1930) +6. 
Even as late as 1934 Tagliavint maintained that there were certain 
tendencies, particularly phonetic, which may be inherited and crop up again 
after many generations. Like other eminent philologists such as Wartburg, 
Dauzat and Meillet himself, Tagliavini believed in the Lamarckian 
superstition. Such quasi-biological beliefs are therefore of no interest 
today except as an admission that the linguist once looked to genetics 
for an intelligible interpretation of at least one influence of the 
substratum. 

Needless to say, the cogency of such an admission depends on 
whether it is conclusively possible to vindicate the existence of de- 
ferred action in the sense defined. The historic background of 
examples most commonly cited is misty. For instance, the consonant 
cluster nd < nt, ng < nk of Osco-Umbrian allegedly turns up at a 
very late period in dialects of South Italy, and the u sound of modern 
French and German allegedly restores a previously suppressed Celtic 
vowel sound of the same region. We are on more solid ground, when 
we examine the highly characteristic shift f > h in Spanish. This we 
commonly attribute to an Iberian substratum, though, until our own 
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century not attested in documents written before the XI Vth. In the 
last fifty years the first reference has been pushed back by successive 
stages to the [Xth century. Indeed Medieval research now leads us 
to believe that there is a complete personal link between those who 
substituted an h-sound for initial f in other languages of the pre- 
Romance* era and those who still do so today, or at least have done 
so until comparatively recent times. Menéndez Pidal, the father of 
modern Spanish philology, has shown that pre-Romance survivals 
in Spanish such as perro, guijarro, barranco, etc. are not documented 
before the XIIIth or XI Vth century; but does this justify our belief 
in their spontaneous resurgence as part of the vocabulary of Castilian 
after many centuries of absence? 

To be sure, we have no continuous documentation of the com- 
monly unprintable four-letter words of Anglo-Saxon origin now 
found in modern, colloquial, sub-standard English; but no one on 
that account would seriously suggest that they are, in this century 
a mushroom growth in the Edwardian Dublin of Joyce or in the 
turbulent Anglo-Saxon world of Hemingway. In the same way it has 
become more and more apparent that certain sounds as well as 
certain words have been handed down from mother to child, over 
the centuries. In the words of Menéndez Pidal (1% p. 8): 

Para suplir nuestra carencia de datos durante varios siglos no pensemos en 
una accién diferida, no en una fuerza latente inactiva cuya operacion solo 
reaparece muy tarde; pensemos sdlo en un estado de actividad latente, un uso 
lingiiistico propio del idioma socialmente deconsiderado, uso que primero se 
introduce subrepticiosamente en la lengua adoptiva como un bajo defecto, re- 
chazado en absoluto por todo hablante culto, uso que después va ganando poco a 
poco el gusto de las generaciones sucesivas, a través de los siglos, en reacciones 
de llaneza_y desafectacién, llegando a ser tolerado entre la gente culta, hasta 
que al fin se hace preponderante _y aun exclusivo. 

Morgan Watkin’ falls into the same kind of error as Darlington 
when he attempts to revive the neglected theory of Rhys and Morris 
Jones. This theory seeks an explanation for some of the peculiarities 
of Welsh by postulating a non-Aryan population with a Hamitic 
language before the conquest of Wales by the Iron-Age Celtic in- 
vaders. To Watkin the existence of this suppositious Hamitic substra- 
tum is both a linguistic, and by the same token genetic, reality. Less 
cautious than Darlington, he enlists genetics alike in the service of 


* This explanation is not accepted by Profs. 7. Orr (Edinburgh) and W. D. Elcock 
(Westfield College) and others. 
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syntax, idiom (sic), accent and intonation, including the Welsh hwyl 
and the white North African Muezzin’s call to prayer, though he 
does not mention the chant of the black North Nigerian. Linking 
Cader Idris with the Berber personal name Idriss is ingenious but 
scarcely transcends the level of special pleading. In fact, I see no 
need for an ad hoc explanation of pre-Celtic survivals in Welsh in the 
jargon of modern genetics or otherwise. Syntax and intonation are 
passed on from individual to individual, from generation to genera- 
tion, as are vocabulary and sounds. The new language borrows them 
from the old in the stage bilingualism, as we have seen above. 

Elsewhere (p. 29) Morgan Watkin associates the Basque blood 
groups and dental fricatives. There, his statement that the Basques 
have a strongly developed ¢h-sound requires qualification. Basque z°* 
is not a dental fricative but a voiceless alveolo-dental s similar to the 
most usual s of Andalusia and Spanish America. I know of no Basque 
dialect where it could possibly be represented by Watkin’s tth which 
I take to be #0 in my notation. The digraphs ¢s and tz represent 
affricates and not fricatives. Thus blood group O and dental frica- 
tive 9 cannot be correlated in the Basque dialects since 0 does not 
exist there. The dental fricative 6 does, however, appear as a sub- 
phonemic medial variant of /d/ in some (but by no means all) 
dialects. En passant, I should like to point out that many Basques are 
bilingual and that, as a result, two of their dialects have been in- 
fluenced by sounds in the neighbouring Romance languages, French 
and Spanish, which are the languages of prestige in the Basque 
country. Souletin uses the French u-sound (of rue, etc.) and Guipuzcoan 
the Spanish jota (j pronounced like the final consonant in Scottish 
loch). Earlier Basque seems uniformly to have used a j-sound similar 
to that of modern standard French j (a voiced palatal fricative). 
They pronounce it so today on the French side of the Pyrenees and 
in the Spanish province of Biscay, where it is losing ground to the 
jota. Here indeed, we see the bilingual process in action. Morgan 
Watkin should also have realized that the sound // in Welsh (p. 29) 
is found in many languages, including English where it has, of course, 
only a subphonemic value, e.g. in English cycling, Hitler, etc. In English 
it is a member of phoneme /I/. 

Before attempting to relate blood groups and alleged facility for 
utterance of certain sounds, I suggest that writers of his persuasion 
should acquire a deeper knowledge of the phonetic systems of the 
languages involved, and that they should get to know something 
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about the work that has been done by linguists in the last fifty years. 
As Darlington himself says in The Facts of Life (p. 422)". 2 the ereat 
difficulty of merging two sciences lies in the obstinate refusal of the 
scientific specialist to understand his nearest neighbours.” 

Neither Darlington nor Morgan Watkin seem prepared to admit 
that the quality which other biologists (* p. 133, 135) have called hu- 
man educability is a far more essential component of language than 
the genetic basis of variability with respect to the organs of speech. 
Man has not responded to his environment in such a way that his or- 
organs of speech will force him (somewhat Jansenistically) every few 
generations to make sounds which his neighbours find difficult. His 
peculiar specific make-up has made him more and more flexible 
and less and less specialized as a sound-maker. That he is thus 
different from the parrot, cuckoo or jackass is indeed a consequence 
of his own genetic constitution. 


Summary 


Although the dental fricatives [6], [6] occur in many Western 
European Languages, we are not in a position to state that the areas 
where they are commonest are inhabited by communities with a 
high frequency of blood group 0. 

These sounds, though comparatively rare among the languages 
of the world, are by no means restricted to the Eurasian region. 

It is also claimed that the phonetic preference of both the 
individual and the group depends on cultural rather than racial 
background. 


Kusammenfassung 


Wenn auch die Zahnreibelaute [9], [0] in vielen westeuropdischen Sprachen auf- 
treten, sind wir doch nicht in der Lage, festzustellen, ob die Gebiete, in denen sie sehr 
verbreitet sind, von Menschen bewohnt werden, bei denen die Blutgruppe O besonders 
haufig ist. 

Diese Laute sind — obwohl sie in den Sprachen der Welt verhaltnismaBig selten 
vorkommen — keineswegs auf Europa beschrankt. 

Sowohl der einzelne wie die Gruppen bevorzugen bei der Auswahl der Laute mehr 
kulturelle als rassische Gesichtspunkte. 


Résumé 


Bien que les fricatives dentales [6] et [0] se rencontrent dans de nombreuses langues 
d’Europe occidentale, nous ne sommes cependant pas en mesure d’établir si les terri- 
toires dans lesquels elles sont trés répandues sont habités par des individus chez lesquels 
le groupe sanguin O est particuli¢rement fréquent. 
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Bien qu’ils apparaissent avec une relative rareté dans les langues du monde, ces 


sons ne sont en aucune fagon restreints a |’Europe. 


Dans le choix des sons, l’individu aussi bien que le groupe fait passer au premier 


plan des considérations culturelles bien plus que raciales. 


Bibliography 


. Boas, F.: Handbook of American Indian Languages (Smithsonian Inst., Hamburg/ 


New York 1933). 


. Darlington, C. D. and Mather, K.: Elements of Genetics (Allen & Unwin, London 


1949). 


. Dunn, L. C. and Dobzhansky, Th.: Heredity, Race and Society (The New American 


Library, New York 1954). 


. la Flesche, Francis: A Dictionary of the Osage Language (Bulletin of American 


Ethnology 109, Washington 1932). 


. Freyre, G.: Case grande e senzala; 4. ed. (J. Olympio, Rio de Janeiro 1943), cf. Put- 


nam, S. 


. Geoghegan, R. H.: The Aleut Language (Smithsonian Inst., Washington 1944). 
. De Goeje, C. H.: Etudes linguistiques caraibes (1909). 
. Harrington, J. P.: Vocabulary of the Kiowa Language (Bulletin of American Eth- 


nology 84, Washington 1928). 


. Hogben, L.: Human Biology and Human Speech. Brit. J. prevent. soc. Med. J0: 


63-74 (1956). 


. Homburger, L.: The Negro-African Languages, p. 42 (Kegan, London 1947). 
. De Lacy O’ Leary, E.: Colloquial Arabic; 3rd. ed. (Kegan, Trench, Trubner & Co., 


London 1925). 


. Lehmann, W.: Die Sprachen Zentral-Amerikas; in Zentral-Amerika (Berlin 1920). 
. Mathews, W. K.: Languages of the U.S.S.R. (University Press, Cambridge 1951). 
. Meillet, A.: Bull. Soc. Ling. (1930). 

. Meillet, A. et Cohen, M.: Les Langues du monde, p. 854, Nouv. Ed. (Société de 


Linguistique de Paris, Paris 1952). 


. Menéndez Pidal, R.: Modo de obrar el substrato lingiiistico. RFE t. XXXIV Cuader- 


nos. 1-4. 


- Mourant, A. E. and Morgan Watkin, I.: Blood Groups, Anthropology and Languages 


in Wales and the Western Countries. Heredity 6: 13 (1952). 


- Mourant, A. E.: The Distribution of the Human Blood Groups (Blackwell, Oxford 


1954). 


. Ojansuu, H.: Suomen lounai smurteiden aannehistoria XXX, II, p. 45 ff. 
. Putnam, S.: The Masters and the Slaves. Translation of: Freyre, G. cf.) (Knopf, New 


York 1946). 


. Ray, S. H.: A comparative Study of the Melanesian Island Languages, p. 498 


(University Press, Cambridge 1926). 


. Rens, L. L. E.: The Historical and Social Background of Surinam Negro-English 


(Amsterdam 1953). 


. Szinnyei, J.: Magyar nyelvhasonlitas; 7. Aufl., p. 36. 

. Thompson, R. W.: Nature 174: 10095 (1954). 

. Tomas, T. N.: Observaciones sobre el papiamento. NRFH 7: 183-189 (1953). 

. Tovar, A.: La lengua Vasca, p. 38 (Biblioteca Vascongada de los Amigos del Pais, 


San Sebastian 1950). 


Author’s address : Robert Wallace Thompson, Universitity of Hong Kong, Department of Modern 


Languages, Hong Kong 


Husson, R.: Phonetica 2: 193-198 (1958). 


Einige Ergebnisse von Untersuchungen 
der akustischen Struktur der Vokale 


Von RAOUL HUSSON (Sorbonne) 


Untersuchungsinstrumentarium 


Wir haben uns der sogenannten Differenzial-Frequenzver- 
starker von Dr.-Ing. Pimonow systematisch bedient. Diese Vorrich- 
tungen ermoglichen, innerhalb eines komplexen (periodischen oder 
nichtperiodischen) Gebietes die Intensitaét jedes beliebigen Fre- 
quenzbereichs nach Wahl zu erhdhen oder herabzusetzen. Jeder 
Apparat tragt am Anfang ein empfindliches Mikrophon und am 
Ausgang entweder einen Lautsprecher oder Kopfhorer. Wir haben 
Versuchspersonen beiderlei Geschlechts untersucht mit ausgebilde- 
ten und mit nichtausgebildeten Stimmen, vorwiegend Kiinstler mit 
kraftiger Stimme in allen Registern und in ihrem ganzen Stimm- 
umfang. Die Kontrolle der Abanderungen der Teilton-Zusammen- 
setzungen l4Bt sich leicht am Leuchtschirm eines Frequenzanalysa- 
tors ablesen. Die Abanderungen der Spannung des Sphincter laryn- 
gis lassen sichohne Schwierigkeit laryngo-stroboskopisch beobachten. 
Die Abanderungen im Bucco-Pharynx und am Velum koénnen am 
radioskopischen Schirm betrachtet werden. 


Nicht-Nasalvokale 


G. Beckmann (Kiel) konnte 1956 nach Entfernung des bucco- 
pharyngalen Ansatzrohrs die akustische Struktur des primaren 
Glottistons experimentell erforschen. Dieser primare Glottiston ist 
ein Sirenenton, d. h. er besteht aus einer Mischung von merklich 
gleich starken Frequenzen, von denen die tiefste die der Schwin- 
gungen der Stimmlippen ist und deren héchste mit der Spannung 
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der Glottisschlage (2000 Hz bei schwachen Schlagen, etwa 5500 Hz 
bei sehr starken Stimmen) zunimmt (Abb. 1, senkrechte Schraffie- 
rungen). 

Unsere experimentelle Untersuchung hat gezeigt, daB die Aus- 
breitung im Bereich des bucco-pharyngalen Ansatzrohrs, und zwar 
von der Glottis bis zu den Lippen, die oben beschriebene Teilton- 
zusammensetzung folgendermaBen andert: 

1. Die Einschnittfrequenz des bucco-pharyngalen Gebietes — 
laut einem von Yves Roccard? eingefiihrten wichtigen Begriff — ist 
grob zwischen 2200 und 2500 Hz enthalten. Unter dieser Frequenz 
wird die Luft dieses Raums «in Bausch und Bogen » zuriickgeschleu- 
dert, und es konnen an verschiedenen Stellen des Raums Resonanzen 
«hangen bleiben». Oberhalb dieser Frequenz gibt es eigentlich eine 
«Ausbreitung»; die sehr verschiedenen Resonanzbedingungen wer- 
den nicht mehr verwirklicht, und die Teile der Teilton-Zusammen- 
setzung werden ohne nennenswerte Veranderungen ibertragen’. 

2. Hieraus ergibt sich, daB, wenn die «Spitzen » des endgiiltigen 
Vokalspektrums tiefer sind als die Einschnittfrequenz, sie tatsachlich 
Resonanzraumen entsprechen, die von der Gestalt des Raums be- 
stimmt werden. Liegen sie hoher als die Einschnittfrequenz, so ent- 
sprechen sie einfach einigen starken Teiltonen der Teiltonzusam- 
mensetzung, wenig verandert auf Grund des Durchgangs durch den 
Raum. Folglich muf die Bezeichnung «Vokalformant» ausschlieB- 
lich den «Intensitatsgipfeln», die tiefer sind als die Einschnitt- 
frequenz, zugedacht werden, da nur sie von dem EinfluB des Reso- 
nanzraums auf die Teilton-Zusammensetzung der Glottisabhangen. 

3. Wir haben festgestellt, daB jeder menschliche Vokal aus zwei 
tiefer als die Einschnittfrequenz liegenden Hauptformanten besteht, 
die ihm die eigentliche Vokalklangfarbe (oder seine Vokalitat) auf- 
driicken. Der starkere Formant wird durch eine Mundresonanz 
bestimmt, und er braucht nicht unbedingt der héchste zu sein. Der 
andere entspricht einer im Pharynx entwickelten Resonanz. Beide 
sind eng verbunden (gekoppelt), wobei die Verbindung bei den 
«geschlossenen» gréfer ist als bei den «offenen» Tonen. Fiir jede 
Grundvokalitat (oder Vokaltypus) hangen die Tonalbereiche, in 
denen sich jeder dieser beiden Formanten (oder Formantengebiete) 
befindet, nicht von dem Grundton ab, sie sind aber umfangreich 
(250-600 Hz). 

4. Beim Verlassen des Mundraums ist also das Spektrum in 
sieben Tonalgebiete zerlegbar: die Formantengebiete F, und F,; 
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die Vor-, Zwischen- und Oberformantengebiete A, B und CG, die tiefer 
als die Einschnittfrequenz liegen; die Oberformantengebiete D und 
E, die hoher als die Einschnittfrequenz liegen, getrennt etwa um 
3500 Hz (Abb. 1). Wir haben feststellen knnen$, daB die akustischen 
Bestandteile jedes Gebietes folgendermaBen zur Klangfarbe jedes 
Vokals beitragen: a) die Gebiete F, und F, verleihen die Vokalitat 
(den Vokalcharakter), da der «Mundgipfel» stets am wirksamsten 
ist; b) die Gebiete A, B und C (die tiefer liegen als die Einschnitt- 
frequenz) verleihen die « Rundung » (oder die « Dicke») des Vokals; 
c) die Gebiete D und E (die héher sind als die Einschnittfrequenz) 
verleihen dem Vokal seinen « Glanz» (oder das « Durchdringende»), 
diese Aufgabe kommt vorwiegend dem Gebiet D zu, wogegen Ge- 
biet E (das oft nicht vorhanden ist) dem Klang eine besondere 
« Harte» verleiht. 
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5. Das gleichzeitige «Abkammen» dieser beiden Formanten F, 
und F, auf jedem Vokal laBt eine von jeder Vokalitat entbloBte und 
ziemlich gleichformige Klangfarbe fortbestehen. Sie hangt nur sehr 
wenig von dem erzeugten Vokal und von dem Grundton ab. Sie 
scheint aber fiir jede Versuchsperson kennzeichnend zu sein. Aus 
diesem Grund nennen wir sie «individuelle auBervokalische Grund- 
klangfarbe»?. 
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Nasalvokale 


Die vier Nasalvokale (4, é, 6, @) unterscheiden sich von den 
vier entsprechenden offenen Vokalen a, ¢, 0, e nur durch Uber- 
lagerung eines mit « Nasalisation» bezeichneten Vorgangs, der er- 
zeugt wird durch eine maBige und unvollstandige Senkung des 
Velums wahrend ihres Zustandekommens. Bis auf den heutigen Tag 
hatten Phonetiker und Akustiker geglaubt, daB die Nasalisation 
durch das Hinzukommen von «Sonderformanten», die von Reso- 
nanzfaktoren im Nasenraum abhingen, entstand. Aber alle Versuche, 
diese Faktoren zu bestimmen, blieben stets erfolglos. Mehr als 20 ver- 
meintliche Formanten (zwischen 200 und 7500 Hz) wurden von den 
verschiedenen Forschern herbeigeholt, die aber eine lacherlich ge- 
ringe Intensitat aufwiesen. Auch die Versuche einer Synthese von 
Nasallauten durch Hinzufiigen von diesen vermeintlichen « Nasal- 
formanten» blieben stets voéllig negativ. 


In Wirklichkeit mu8 die Rolle des Nasenraums bei der Wasalisa- 
tion der Vokale wie folgt analysiert werden: Der Rhino-Pharynx spielt 
die Rolle eines auf das bucco-pharyngale Gebiet aufgesetzten Filters 
« Passe-Bas», aber das Durchlaufen durch die Gange und die Nasen- 
lécher setzt die Durchlassigkeit des Filters fiir sehr hohe Frequenzen 
herab und verwandelt den Filter in einen Filter « Enléve-Bande»?. 


Diese Analyse erklart die friiheren von Barczinski und Thienhaus® 
erzielten Ergebnisse, die damals fiir unerklarlich und irrefiihrend 
gehalten wurden. Unsere Experimente haben ohne Schwierigkeit 
bestatigt, daB die Nasalisation bei jedem Vokal zustande kommt, 
wenn man die Intensitaten zwischen 1200 und 2000 Hz geniigend 
ausmerzt (Abb. 1, gestrichelte Linie). Bei Versuchspersonen mit 
weitem Rhino-Pharynx senkt sich dieser Bereich bis 1000-1800 Hz, 
dagegen steigt er bis 1400-2200 Hz bei engem Rhino-Pharynx, 
wie wir durch Quer-Radiographien haben kontrollieren kénnen. 
Umgekehrt unterdriickt man die Wasalisation oder setzt sie wenigstens 
entsprechend der kiinstlichen Verstarkung weiter herab, wenn man 
diesen Frequenzumfang vergréBert und ihn auf einen Nasalvokal 
eimwirken laBt?. 

Folgende Nebenerscheinungen begleiten noch die Nasalisation: 
1. Gleiten der bucco-pharyngalen Formanten durch Veranderung 
der Koppelung im Bucco-Pharynx; 2. Behindernde Einschrankung 
der Glottistatigkeit; 3. Erscheinen von supervelaren Abzugsténen 
mit Hochfrequenzen, die im allgemeinen nicht stark sind‘. 
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Kusammenfassung 


Die Einschnittfrequenz des bucco-pharyngalen Gebietes ist grob 
zwischen 2200 und 2500 Hz enthalten. — Nicht-Nasalvokale: Die 
zwei « Hauptspitzen » des endgiiltigen Vokalspektrums, tiefer als die 
Einschnittfrequenz, entsprechen tatsachlich einer im Pharynx und 
im Mund entwickelten Resonanz. Die «Spitzen», hoher als die Ein- 
schnittfrequenz, entsprechen einfach einigen starken Teilténen der 
Teiltonzusammensetzung, die wenig verandert sind auf Grund des 
Durchgangs durch den Raum. Die zwei Formantengebiete verleihen 
die Vokalitat. Die anderen Gebiete, die tiefer liegen als die Ein- 
schnittfrequenz, verleihen die « Rundung» des Vokals. Die Gebiete, 
die hoher sind als die Einschnittfrequenz, verleihen dem Vokal seinen 
«Glanz». Das gleichzeitige Abkammen der beiden Formanten ]aBt 
eine von jeder Vokalitat entbl6Bte Klangfarbe fortbestehen, aber 
fiir jede Versuchsperson kennzeichnend, und wird «individuelle 
auBervokalische Grundklangfarbe» genannt. — Nasalvokale: Die 
Rolle des Nasenraums bei der Nasalisation der Vokale muB wie folet 
analysiert werden: Der Rhino-Pharynx spielt die Rolle eines Filters 
«Passe-Bas»; aber das Durchlaufen durch die Gange und die Nasen- 
locher verwandelt den Filter in einen «Enléve-Bande». Die Nasali- 
sation kommt bei jedem offenen Vokal zustande, wenn man die 
Intensitaéten zwischen 1200 und 2000 Hz geniigend ausmerzt. Um- 
gekehrt unterdriickt man die Nasalisation, wenn man diesen Fre- 
quenzumfang vergroBert und ihn auf einen Nasalvokal einwirken 
]aBt. Gewisse Nebenerscheinungen begleiten die Nasalisation: Ver- 
anderung der Koppelung im Bucco-Pharynx, Gleiten der bucco- 
pharyngalen Formanten, behindernde Einschrankung der Glottis- 
tatigkeit, Erscheinen von supervelaren Abzugst6nen von hohen 
Frequenzen (nicht stark). 


Summary 


The cutoff frequency of the bucco-pharyngeal region is roughly between 2200 and 
2500 cps. — Non-nasalized vowels: The two peaks of the eventual vowel spectrum which 
are lower than the cutoff frequency correspond in fact to resonances developed in the 
pharynx and in the mouth. The peaks which are higher than the cutoff frequency 
correspond simply to certain strong components of the harmonic structure which are 
little altered by their transmission through the cavity. The two formant-areas are 
responsible for vocality. The other areas, when they are lower in frequency than the 
cut-off, give “rounding” to the vowel, and when higher than the cut-off they give the 
vowel its “brilliance”. If both formants are simultaneously filtered out, a tone-colour 
persists which has been stripped of all vocality but is characteristic of each particular 
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speaker and is therefore termed “individual extra-vocalic basis tone-colour”. Nasal 
vowels: the role of the nasal cavity in the nasalization of vowels must be analysed as 
follows: the naso-pharynx plays the part of a low-pass filter, but the passage of air 
through the nasal cavity and nostrils changes the filter into a band-stop. Nasalization 
arises with every open vowel if the energy between 1200 and 2000 cps are sufficiently 
eliminated. Conversely, nasalization is suppressed if this frequency range is amplified 
and applied to a nasal vowel. There are certain side effects accompanying nasalization: 
alteration of the coupling in the oro-pharynx, gliding of the bucco-pharyngeal formants, 
restriction of glottal activity, and the appearance of super-velar difference tones from 
high frequencies (not strong). 


Résumé 


La fréquence de coupure du pavillon pharyngo-buccal est grosso modo comprise 
2200 et 2500 cycles. — Voyelles non-nasalisées: Les deux «clochers» principaux du 
spectre vocal définitif, inférieurs a la fréquence de coupure, correspondent a des états 
résonantiels développés dans le pharynx et dans la bouche. Les «clochers» supérieurs 
a la fréquence de coupure correspondent simplement a des partiels intenses dans la 
fourniture laryngée et peu modifiés par la traversée du pavillon. Les deux régions 
formantiques conférent la vocalité. Les régions autres et inférieures a la fréquence de 
coupure donnent la plénitude de la voyelle. Les régions supérieures a la fréquence de 
coupure conférent a la voyelle son éclat. L’écrétement simultané des deux formants 
laisse subsister un timbre dépourvu de vocalité, mais caractéristique de chaque sujet, 
dit «timbre extra-vocalique individuel fondamental». — Voyelles nasalisées: Le réle des 
cavités nasales dans la nasalisation des voyelles doit étre analysé comme suit: le rhino- 
pharynx joue le réle d’un filtre «passe-bas»; mais le passage par les méats et les narines 
le transforme en filtre «enléve-bande». La nasalisation apparait sur toute voyelle 
ouverte lorsqu’on ampute suffsamment les intensité comprises entre 1200 et 2000 cycles 
environ. Inversement, l’amplification de cette bande de fréquences diminue ou supprime 
la nasalisation. Certains phénomenes secondaires accompagnent la nasalisation: altéra- 
tion du couplage pharyngo-buccal, glissement des formants, modification impédancielle 
de la fourniture glottique, apparition de sons d’écoulement sus-vélaires de haute- 
fréquences (peu intenses). 
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Regeln der deutschen Silbenmelodie* 


Von ADALBERT MAACK, Braunschweig 


Einleitung 


In einer Reihe friiherer Untersuchungen! habe ich mich mit 
den Formen der Lautmelodie beschaftigt. Ich glaube dabei den 
Nachweis gefiihrt zu haben, da8B der weitaus gréBte Teil (im Durch- 
schnitt uber 80%) aller Laute — ziemlich gleich, ob Vokale, 
Diphthonge oder stimmhafte Konsonanten — einen im wesentlichen 
geradlinigen Verlauf zeigt und da8 die restlichen Laute in tber- 
wiegendem Mafe eine nur efach gekrimmte Melodieform auf- 
weisen. Fiir die Silbenmelodie liegen m.W. ahnliche eingehende 
Untersuchungen noch nicht vor. Wolfgang Bethge hat kiirzlich? das 
Thema im Zusammenhang mit den Abhoreraussagen iiber die 
Lautmelodie kurz gestreift, aber nur fiir das Verhaltnis zwischen 
Vokal und folgendem Konsonanten und unter einem anderen Ge- 
sichtspunkt®. Bethge hat dabei festgestellt, daB sich die Abhorer bei 
der Beurteilung der Lautmelodie durch den Si/benmelodieverlauf 
beeinflussen lassen. Es erhebt sich darauf die Frage, ob man die 
objektive, gemessene Silbenmelodie, ahnlich wie die Lautmelodie, 
im wesentlichen durch eine Gerade bzw. eine héchstens einfach 
gekriimmte Kurve darstellen kann, oder ob die Silbenmelodie an- 
dere — gegebenenfalls welche — Formen aufweist, und welche Ge- 
setze tiberhaupt fiir die Silbenmelodie gelten. 

Die vorliegende Untersuchung stiitzt sich auf zwei phono- 


* Anmerkung der Redaktion: Diese Arbeit gehért inhaltlich zu den Arbeiten des- 
selben Verfassers, die im 1. Jahrgang dieser Zeitschrift verdffentlicht wurden — siehe 
dort S. 206 ff.; S. 216 ff. und S. 230 ff. —; aus drucktechnischen Griinden konnte sie 
erst hier ver6ffentlicht werden. 

1 4. Maack, 1938, S. 145 ff.; 1939, S. 27 ff.; 1955, S. 294 ff. 

2 W. Bethge, 1953, S. 320 ff. 

3 Vgl. auch weiter unten. 
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metrische Textlisten: eine Erzahlung, gesprochen von einem in 
Berlin wohnenden Arbeiter schlesischer Herkunft*, und einen Vor- 
lesetext (aus «Gésta Berling» von Selma Lagerlof), gesprochen von 
einem Wissenschaftler mit leichtem schlesischen Akzent?. 
Zunachst ist die Frage zu klaren, welche Silben zur Unter- 
suchung heranzuziehen sind. Es gibt Silben mit einem, zwei und 
mehr Sonorlauten®. Die sehr haufigen Silben mit nur einem Sonor- 
laut, d. h. einem Sonanten als Silbentrager und einem oder meh- 
reren stimmlosen Konsonanten, fallen natiirlich von vornherein aus. 
In der Hauptsache miissen wir uns stiitzen auf zweisonorige Silben: 
mit einem Sonanten und einem (vorhergehenden oder folgenden) 
stimmhaften Konsonanten — wobei noch andere, stimmlose Kon- 
sonanten vorhergehen oder folgen kénnen. Dreisonorige Silben 
sind nicht so haufig und kommen fast nur in der Reihenfolge: 
Konsonant—Sonant—Konsonant’ vor. Denn die Lautfolgen: Kon- 
sonant—Konsonant—Sonant und Sonant—Konsonant—Konsonant 
sind einerseits an sich noch seltener, anderseits sind dort, wo sie vor- 
kommen, oft nicht alle Sonoren deutlich periodisierbar, d. h. der 
Melodieverlauf ist nicht eindeutig festzustellen. Dasselbe gilt na- 
tirlich in noch héherem Mabe fiir vier- und mehrsonorige Silben. 
Wir sind deshalb fiir die Untersuchung auf die zweisonorigen Silben 
und die dreisonorigen in der genannten Lautfolge angewiesen. 
Wenn nun die Silbenmelodie — ahnlich wie die Lautmelodie — 
einen tiberwiegend geradlinigen Verlauf zeigen wiirde, diirften zwi- 
schen den Melodiewinkeln® der einzelnen stimmhaften Laute einer 
Silbe keine allzu groBen Differenzen vorkommen, d. h. der Melodie- 
winkel des silbentragenden Sonanten miiBte mit dem des vorher- 
gehenden bzw. folgenden Konsonanten groBe Ahnlichkeit haben, 
m. a. W.: es miiBte zwischen dem Melodiewinkel des Sonanten und 
dem des Konsonanten eine ziemlich hohe positive Korrelation be- 
stehen. Man kann im allgemeinen nur zwischen zwei Variablen 
Korrelationen aufstellen: in unserm Falle also in zweisonorigen 
Silben zwischen dem Sonantenwinkel und dem Winkel des vorher- 
gehenden bzw. folgenden Konsonanten. Dreisonorige Silben als 


4 Phonom. Forsch., Reihe B, Bd. 3. 

5 Phonom. Forsch., Reihe B, Bd. 6 (noch nicht erschienen). 

* Unter «Sonoren» seien in dieser Arbeit samtliche stimmhaften Laute verstanden, 
also Sonanten (d. h. Vokale und Diphthonge) und stimmhafte Konsonanten. 

” Der Einfachheit halber sei im folgenden, wo kein Mi®verstandnis méglich ist, der 
Zusatz «stimmhaft» vor «Konsonant» fortgelassen. 


8 Uber die Berechnung des Melodiewinkels vgl. E. Zwirner und K. Zwirner, S. 4 ff. 
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Ganzes k6nnen nicht ohne weiteres korrelationsstatistisch untersucht 
werden®. Wir brauchen auf diese Silben jedoch nicht zu verzichten, 
wenn wir sie auf einfache Weise in die Lautfolgen: Sonant—Konso- 
nant und Konsonant-—Sonant aufteilen®. 

Wir werden also zunachst die Korrelationen zwischen dem 
Sonanten- und dem Konsonantenwinkel fiir alle Lautfolgen Sonant— 
Konsonant bzw. Konsonant-Sonant innerhalb einer Silbe auf- 
stellen, ohne Riicksicht darauf, ob die Laute in zwei- oder drei- 
sonorigen Silben stehen. Als Ganzes werden wir die dreisonorigen 
Silben im zweiten Teil dieser Arbeit im Zusammenhang mit dem 
Trendverfahren behandeln. — Fiir die Lautfolge Sonant-Konsonant 
stehen uns in Bd.3 181, in Bd.6 227 und fiir die Lautfolge Konso- 
nant—Sonant in Bd. 3 128, in Bd. 6 138 Falle zur Verfiigung. 


Die Korrelationen: Sonanten-Melodiewinkel|Konsonanten-Melodiewinkel 


In friiheren Arbeiten habe ich wiederholt auf die Wichtigkeit 
der Homogenitat der Kollektive hingewiesen. Das hei®t, man kann 
ein Material nicht variations- oder korrelationsstatistisch unter- 
suchen, wenn es in sich nicht einheitlich ist. Deshalb wurde es 
bisher stets in vier wesentlich voneinander verschiedene phono- 
logische Gruppen? aufgeteilt. Neben den Korrelationen fir alle 
Sonanten sollen auch diesmal die Korrelationen fiir betonte und 
unbetonte Silben (genauer gesagt: fiir phonologisch betonte und 
phonologisch unbetonte Silbentrager) getrennt gegeben werden. An 
sich ist es auch notig, zwischen Langen und Kiirzen zu unterschei- 
den. Doch kénnen wir hier eine Zusammenfassung vornehmen, da 
die Differenzen nicht grofB sind. Gerade bei Korrelationen ist es auch 
wichtig, das Material nicht durch allzu starke Aufteilung zu klein zu 
machen. Deshalb habe ich mich bei der vorliegenden Arbeit nur 
fiir die Zweiteilung in «betont» und «unbetont» entschieden. 

Es gibt allerdings hinsichtlich der Silbenmelodie einige charak- 
teristische Unterschiede zwischen Langen und Kiirzen. Auf diese 
werden wir sogleich zu sprechen kommen. 

9 Es gibt allerdings auch «dreidimensionale» Korrelationen (vgl. E. Czuber). Doch 
erfordern diese einerseits eine sehr umstandliche mathematische Berechnung, anderseits 


sind die Ergebnisse weniger anschaulich als bei der zweidimensionalen Korrelation, die 
wir anwenden. 

9a Stimmhafte Konsonanten im Silbenschnitt (nach kurzen betonten Sonanten) 
wurden sowohl mit dem vorhergehenden wie auch mit dem folgenden Sonanten als 
silbenbildend angesehen. 

10 Lang betont, lang unbetont, kurz betont, kurz unbetont. 
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° 
Son, steil ————> flach itech? ate 
Kons. Follwinkel Steigwinkel 


flach <——__ steil 
Follwinkel 


oOo 
° 


Coe LICH 
Steigwinkel 


steil 


Mx 


Abb. 1. Schema der Korrelation: 
Sonanten-Melodiewinkel / Konsonanten-Melodiewinkel 
fir die Lautfolgen: 
Sonant—Konsonant und Konsonant-Sonant 


Erklarung: Mx = arithm. Mittel der Sonanten-Steig- und -Fallwinkel 
My = arithm. Mittel der Konsonanten-Steig- und -Fallwinkel 
I und III = positive Quadranten 
II und IV = negative Quadranten, durch das Korrelations- 
kreuz Mx My voneinander getrennt 


Das Korrelationsschema (Abb. 1) médge die Verteilung der 
Sonanten- und Konsonantenwinkel auf dem Korrelationsnetz er- 
lautern. Treffen Steigwinkel der Sonanten mit solchen der Kon- 
sonanten zusammen, so liegen sie innerhalb des (positiven) Qua- 
dranten I. Treffen Fallwinkel der Sonanten mit solchen der Kon- 
sonanten zusammen, so liegen sie innerhalb des (positiven) Qua- 
dranten III. Je mehr die Gradzahl der Sonanten- mit der der Kon- 
sonantenwinkel tibereinstimmt, um so naher liegen die Falle an der 
«Linie gleicher Winkel». Treffen Steigwinkel der Sonanten mit 
Fallwinkeln der Konsonanten zusammen, so liegen die Falle im 
(negativen) Quadranten II. Treffen Fallwinkel der Sonanten mit 
Steigwinkeln der Konsonanten zusammen, so liegen die Falle im 
(negativen) Quadranten IV. Positiv nennt man die Korrelation, 
wenn die Falle in den Quadranten I und III, negativ, wenn die 
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Falle in den Quadranten II und IV uberwiegen, wobei noch eine 
Rolle spielt, ob die Falle extrem oder nahe dem Mittelpunkt des 
Korrelationsnetzes angeordnet sind. Im Hochstfalle ist der Koeffi- 
zient r der Korrelation =+ 1. Bei ganzlicher Beziehungslosigkeit 
beider Variablen ist r = 04. 

Fur die verschiedenen Korrelationen wurden die in Tabelle I 
zusammengestellten Koeffizienten errechnet. 


Tab. I 


Koeffizienten der Korrelationen zwischen Sonanten- und Konsonantenwinkeln 


Lautfolge: Lautfolge: 
Sonant-Kons. Kons,-Sonant 
alle  Silben + 0,19 + 0,14 
Bd. 3 ? bet. - 4+.0,27 + 0,09 
unbet. ,, + 0,09 + 0,22 
{ alle oe + 0,28 + 0,19 
Bd.6 | bet. - + 0,26 + 0,05 
\eennce - + 0,10 2015 


Wie die Tabelle zeigt, sind die Koeffizienten allgemein durch- 
aus niedrig, teilweise sehr klein, in einem Falle sogar negativ. Letz- 
teres wiirde bedeuten: Steig- und Fallwinkel der Sonanten sind 
denen der Konsonanten eher entgegengesetzt als gleichlaufend. — 
Mit einer Ausnahme ist die Abhangigkeit zwischen Sonanten- und 
Konsonantenwinkeln bei den unbetonten Sonanten noch geringer 
als bei den betonten. Wir werden darauf weiter unten noch naher 
zu sprechen kommen. Diese Tatsachen sprechen also allein schon 
nicht dafiir, daB die Silbenmelodie im allgemeinen geradlinig ist. 

Im einzelnen muB auffallen, daB der Korrelationskoeffizient 
fiir alle Silben zusammen in Bd. 6 hoher ist als fiir betonte und un- 
betonte, und zwar in beiden Lautfolgen. Normalerweise sollte der 
r-Wert fiir alle Sonanten dazwischenliegen (wie in Bd. 3). Der 
Grund dafiir liegt in der bereits erwahnten Inhomogenitat des 
Gesamtmaterials. Es ist nadmlich sehr wichtig, daB die Kreuzmitten 
zweier Korrelationen (vgl. Abb. 1), die addiert werden sollen (wie 
in unserem Falle betonte und unbetonte Silben) annahernd an der 
gleichen Stelle liegen, m.a.W.: die M,- und M,-Linien beider 


11 Vgl. die in Anm. 9 erwahnte Schrift von E. Czuber. 
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Einzelkorrelationen miissen sich méglichst decken. Ist das nicht der 
Fall, so wiirde man bei deren Addition etwa in denselben Fehler 
verfallen, als wenn man beispielsweise zwei véllig gleiche Korre- 
lationen, deren richtige Addition natiirlich denselben Wert wie fiir 
jede einzelne Korrelation ergibt, unter Verschiebung der Kreuz- 
mitten addieren wollte, wie es unsere schematische Abbildung 2 
zeigt, wo bei jeder Einzelkorrelation r = 0 ist, wahrend die Addi- 
tion einen Korrelationskoeffizienten von + 0,27 ergibt. 


Abb. 2. Korrelationen-Addition unter schrager Kreuzverschiebung. 


Ganz allgemein gilt folgendes: Sind die Kreuzmitten in Rich- 
tung links oben-rechts unten (wie in der Zeichnung) gegenein- 
ander verschoben, so ist durch die Addition die Tendenz zum 
Positiven (gréBerem positiven bzw. kleinerem negativen r) gegeben. 
Sind die Kreuzmitten in der entgegengesetzten Richtung, also 
rechts oben-links unten, gegeneinander verschoben, so ist, wie 
leicht ersichtlich, durch die Addition die Tendenz zum Negativen 
(groBerem negativen bzw. kleinerem positiven r) gegeben.— Werden 
dagegen bei der Addition die Kreuzmitten waagerecht bzw. senk- 
recht verschoben, m. a. W.: fallen nur die beiden M,-Linien bzw. 
nur die beiden M,-Linien nicht zusammen, wahrend die jeweils 
anderen sich decken, so andert sich an dem Wert der Korrelation 
nichts: wie aus Abbildung 3 ohne nahere Erlauterung zu ersehen 
ist. Dies ist fiir das Verstandnis des folgenden wichtig. 

Betrachten wir daraufhin die Lage der Korrelationskreuze bei 
den betonten und bei den unbetonten Silben, so finden wir, daf 
das Sonantenmittel der betonten von dem der unbetonten sehr ver- 
schieden ist, und zwar bei beiden Sprechern: natiirlich, weil die be- 
tonten Sonanten vorwiegend steigend, die unbetonten vorwiegend 
fallend sind. Hinsichtlich der Konsonanten dagegen verhalten sich 
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My Richtung der 
ob Kreuzverschiebung 


Le) 


Abb. 3. Addition der beiden in Abb. 2 gegebenen Korrelationen 
bei senkrechter bzw. waagerechter Kreuzverschiebung. 


reuzverschiebung ; 


die beiden Sprecher nicht gleich: In Bd. 3 liegt das Konsonanten- 
mittel in betonten Silben von dem in unbetonten nur sehr wenig 
entfernt, m.a.W.: die M,-Linien fallen annahernd zusammen. 
GemaB Abbildung 3 andert sich daher bei der Addition der beiden 
Einzelkorrelationen nicht viel, und der Korrelationskoeffizient fiir 
alle Silben liegt in Bd. 3 deshalb anniéhernd in der Mitte zwischen 
dem fiir die betonten und dem fiir die unbetonten Silben. 

In Bd. 6 dagegen bestehen auch bei den Konsonanten groBe 
Verschiedenheiten: In der Lautfolge Sonant-Konsonant sind die 
Konsonantenmittel bei den betonten Silben gegeniiber den unbe- 
tonten um mehr als 5°, in der Lautfolge Konsonant-Sonant sogar 
um mehr als 10° nach der positiven Seite hin verschoben??. Deshalb 
ist bei dieser Lautfolge der Korrelationskoeffizient fiir alle Silben in 
Bd. 6 auch besonders weit von dem fiir betonte und unbetonte 
Silben allein entfernt. Auf die Griinde fiir die Verschiedenheit bei 
den beiden Sprechern einzugehen, ist hier nicht der Platz. — Es 
braucht nicht erst hervorgehoben zu werden, da die Koeffizienten 
der Einzelkorrelationen unter diesen Umstanden den wirklichen 
Verhaltnissen mehr gerecht werden als der Koeffizient ftir alle 
Silben, womit sich die Notwendigkeit der Trennung in betonte und 
unbetonte Silben erwiesen hat. 

Fir die Addition von Langen und Kiirzen gelten natiirlich 
dieselben Grundsatze. Gegeniiber der Opposition betont-unbetont 


12 Da das Sonantenmittel in den betonten Silben gegeniiber dem in unbetonten auch 
viel mehr nach dem Positiven hin liegt, differiert die Kreuzlage bei betonten und un- 
betonten Silben also in der in Abb. 2 angedeuteten Richtung, d. h. die Gesamtkorre- 
lation tendiert mehr zum Positiven hin. 
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bestehen hier wesentliche Unterschiede: Was die Sonanten betrifft, 
so sind lange im Durchschnitt flacher als kurze1*. Da dies nicht nur 
fiir betonte und unbetonte Sonanten, sondern auch fiir steigende 
und fallende Melodiewinkel in annahernd gleichem Mabie gilt, so 
geht schon daraus hervor, daB die M,-Linien der Sonantenmittel 
bei langen und kurzen Sonanten nur wenig voneinander differieren 
kénnen. Da obendrein die Lage bei den Konsonanten nicht viel 
anders ist, kann man, wie oben bereits erwahnt, Silben mit langen 
und Silben mit kurzen Sonanten ohne Bedenken zusammenfassen. 

Trotzdem gibt es, wie ebenfalls oben angedeutet wurde, einige 
Unterschiede zwischen Langen und Kiirzen. Diese hangen mit der 
Form der Sonoren zusammen. Nach steigenden kurzen Sonanten 
setzt sich némlich der Anstieg oft noch bis in den folgenden Kon- 
sonanten hinein fort. Bei steigenden Jangen Sonanten dagegen ist der 
melodische Hohepunkt der Silbe meist schon innerhalb des Sonan- 
ten erreicht1**. Deshalb hat der Konsonant nach steigenden langen 
Sonanten tiberwiegend fallende Tendenz (vgl. Abb. 4, Form III), 
und zwar in beiden Textlisten gleichmaBig zu 73%. Nach kurzen 
steigenden Sonanten hat der Konsonant dagegen im Durchschnitt — 
bei geringer Abweichung zwischen den beiden Sprechern — noch 
zu 37% steigende Gesamttendenz (Abb. 4, Form I), und wo er fallt, 

kurzer 


Sonant Konsonant langer Sonant Konsonant 


Form I Form I Form I 


kurzer 


Konsonant Sonant 


Abb. 4, Schematische Darstellung haufiger Silbenmelodieformen bei kurzen und langen 
Sonanten. 


ist der Winkel doch flacher als nach langen Konsonanten, weil der 
erste, steigende Teil des Konsonanten auf die Gesamtrichtung 
seines Melodieverlaufs verflachend wirkt (Abb. 4, Form II). Hieraus 
geht hervor, daB bei den Kiirzen der Quadrant I starker bzw. der 
Quadrant II schwacher belegt sein muB als bei den Langen (vgl. 
Abb. 1), was wiederum zur Folge hat, daB die Korrelation der 
Kiirzen, da der Quadrant I «positiv», Quadrant II «negativ» 
ist (s. o.), einen hdheren positiven Koeffizienten haben wird. 


13 Vel. A. Maack, 1955, S. 294 fff. 
18a Vel. A. Maack, 1957, bei Anm. 137-141. 
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Neben diesem Unterschied zwischen Langen und Kiirzen bei 
steigender Sonantenmelodie gibt es noch einen etwas weniger deut- 
lichen bei fallender Sonantenmelodie. Es gilt namlich der Satz: 
Nach fallenden kurzen Sonanten sind steigende Konsonanten hau- 
figer als nach fallenden langen Sonanten. Dieser «Richtungs- 
wechsel», wie wir das Umschlagen von steigender zu fallender und 
von fallender zu steigender Melodie in den Lautfolgen Sonant- 
Konsonant und Konsonant—Sonant fortan nennen wollen, ist in 
Bd. 6 etwas seltener als in Bd. 3, aber bei beiden Sprechern ist nach 
fallenden kurzen Sonanten der Richtungswechsel haufiger als bei 
langen: im Durchschnitt beider Texte nach kurzen Sonanten 25%, 
nach langen 15%. (Wie der Vergleich mit den eben gegebenen 
Zahlen erweist, tritt also der Richtungswechsel nach fallenden So- 
nanten ganz erheblich seltener auf als nach steigenden.) 

Da bei kurzen Sonanten der «negative» Quadrant IV (s. Abb. 1) 
demnach etwas starker belegt ist als bei langen, geht der EinfluB 
auf den r-Wert natiirlich dahin, daB bei kurzen Sonanten eine 
leichte negativierende Tendenz besteht, so daB die durch den ersten 
(in Abb. 4 erlauterten) Satz gegebene Tendenz wieder abgeschwacht 
wird. Im ganzen liegen daher zwischen den Korrelationskoeffi- 
zienten der Langen und denen der Kiirzen weder in Bd. 3 noch in 
Bd. 6 nennenswerte Differenzen vor. 

Hinsichtlich der Lautfolge Konsonant-Sonant waren 4hnliche 
Unterschiede zwischen Langen und Kiirzen nicht erkennbar. Ent- 
sprechendes gilt demgemaB auch fiir die Koeffizienten der Einzel- 
korrelationen dieser Lautfolge. 


« Richtungswechsel» und «Winkelnormen» 


Mit dem Richtungswechsel haben wir bereits eines der charak- 
teristischsten Gesetze der Silbenmelodie beriihrt. Der Richtungs- 
wechsel ist einer der Hauptgriinde dafiir, daB die Koeffizienten 
aller Korrelationen so sehr klein sind. Denn er gilt nicht nur fir die so- 
eben etwas naher behandelte Lautfolge Sonant—Konsonant, sondern 
in fast genau demselben MaB8e auch fiir die Folge Konsonant—Sonant. 

Die Haufigkeit des Richtungswechsels fiir die beiden Laut- 
folgen gibt die Tabelle II in Prozentzahlen". Aus der Tabelle geht 

14 Die wenigen Falle mit «gehaltener» Melodie, d. h. wo die Melodie des Sonanten 
bzw. Konsonanten, im ganzen gesehen, weder steigt noch fallt, wurden bei der Berech- 


nung nicht beriicksichtigt. 


14. Phonetica, Vol. 2, No. 3/4, 1958 
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Tab. I 


Prozentzahlen des Richtungswechsels 
Erkl.: Die Ausdriicke «steigend» und «fallend» beziehen sich auf die Sonantenmelodie 


Lautfolge: Lautfolge: 
Sonant-Kons. Kons,-Sonant 
alle { steigend 62 60 
Silben | fallend 32 27 
bet. { steigend 59 61 
Bd. 3 Silben | fallend 30 28 
unbet. steigend 77 57 
Silben fallend 34 Zh 
Gesamtdurchschnitt 45 4] 
alle { steigend 68 40 
Silben | fallend 15 35 
bet. { steigend 65 30 
Bd. 6 < Silben \ fallend 13 63 
unbet. steigend 81 87 
Silben fallend 15 27 
Gesamtdurchschnitt 39 37 


hervor, daB in nicht viel weniger als in der Halfte aller Falle der 
Konsonant eine dem vorhergehenden bzw. folgenden Sonanten 
entgegengesetzte Gesamtmelodierichtung hat, besonders in Bd. 3. 
In Bd. 6 ist der Durchschnitt um etwa 5% geringer. Ob individuelle 
Unterschiede dafiir maBgebend sind, ob es an dem Thema liegt 
(Erzahlung-Vorlesetext), oder ob es sich nur um einen Zufall han- 
delt (die geringe Differenz von 5% schlieBt diese Méglichkeit nicht 
aus), kann hier nicht entschieden werden. In der Lautfolge Kon- 
sonant-Sonant ist der Richtungswechsel bei beiden Sprechern um 
eine Kleinigkeit seltener (in Bd. 6 bei den Fallwinkeln dagegen 
haufiger). 

Wie schon soeben erwahnt wurde, ist der Richtungswechsel bei 
steigenden Sonanten weitaus Ofter als bei fallenden: wie wir aus der 
Tabelle ersehen, sowohl in betonten wie auch in unbetonten Silben. 
Dabei tibersteigt der Prozentsatz der unbetonten Silben sogar noch 
den der betonten: hauptsachlich bei den steigenden, in geringem 
MaBe aber auch bei den fallenden Sonanten. Da der Richtungs- 
wechsel, wie wir gesehen haben, negativierend auf den Korrela- 
tionskoeffizienten wirkt, haben wir nunmehr auch eine Erklarung 
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dafiir, daB die r-Werte der unbetonten Silben noch weniger positiv 
sind als die der betonten. 

Das alles gilt ohne Einschrankung jedoch nur fiir die Lautfolge 
Sonant-Konsonant bei beiden Sprechern. In der Lautfolge Kon- 
sonant-Sonant sind die Gesetze anscheinend weniger fest, wie ja 
auch der Prozentsatz des Richtungswechsels etwas geringer ist. 
In Bd. 3 sind die Verhaltnisse zwischen betonten und unbetonten 
Silben, wenigstens bei den Sonanten mit steigender Melodie, sogar 
umgekehrt. Bezeichnenderweise ist deshalb auch der Korrelations- 
koefizient der unbetonten Silben in Bd. 3 mehr positiv als der der 
betonten: was wir oben als einzige Ausnahme von der Regel kennen- 
gelernt hatten. — In Bd. 6 ist der Richtungswechsel in den unbeton- 
ten Silben zwar im Durchschnitt gréBer als in den betonten, na- 
mentlich bei steigenden Sonanten, weshalb auch der Korrelations- 
koeffizient der unbetonten Silben in Bd. 6 ganz besonders zum 
Negativen tendiert (vgl. Tab. I). Dafiir finden wir aber bei den 
betonten Silben die einzige — und zwar sehr deutliche - Ausnahme 
von der Regel, daB der Richtungswechsel bei den fallenden So- 
nanten seltener ist als bei den steigenden. Um einen Zufall kann es 
sich kaum handeln. Die betonten Silben mit fallender Sonanten- 
melodie sind zwar mit 19 Fallen ziemlich selten, die steigenden 
sind aber mit 40 vertreten, und deren Prozentsatz (30) ist, ver- 
glichen mit dem in allen anderen Gruppen der Lautfolge, auBer- 
ordentlich niedrig. Eine Erklarung fiir diese Erscheinung kann hier 
nicht gegeben werden. Sie stimmt aber iiberein mit dem, was wir 
im folgenden Abschnitt iiber diese Gruppe zu sagen haben. 

Der Richtungswechsel ist zwar, besonders bei steigenden So- 
nanten, eine recht haufige Erscheinung. Immerhin gibt es doch aber 
noch ziemlich viele Ausnahmen. Im Grunde genommen ist der 
Richtungswechsel nur die extreme Form einer Erscheinung, die 
mit noch viel geringeren Ausnahmen gilt — auch fiir fallende So- 
nantenmelodie — und die ich deshalb als die «Winkelnorm» der 
Silbenmelodie bezeichnen méchte. Haben wir in der Lautfolge 
Sonant—Konsonant bei steigenden Sonanten haufig diese Form (als 


Richtungswechsel): “s K_ , so ist die «abgemilderte» Form diese: 


s kK ,d.h. der Konsonant braucht nicht gerade zu fallen, aber er 


steigt weniger. Ahnlich ware fiir die extreme Form bei steigenden 
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Sonanten der Lautfolge Konsonant-Sonant: K gs die abgemil- 


derte Form diese: Ks , d.h. auch in diesem Falle steigt der 


Konsonant weniger als der Sonant. — Entsprechendes gilt fiir die 
Fallwinkel. Die (verhaltnismaBig seltene) Extremform der Folge 


Sonant-—Konsonant ist diese: s K . Die abgemilderte Form: 


S K_ besagt, daB der Konsonant nach fallendem Sonanten weniger 


fallt als dieser. Und ahnlich bei der Lautfolge Konsonant—Sonant: 


Fur die Extremform: K S_ ist die abgemilderte Form diese: k § ; 
d.h. auch hier fallt der Konsonant weniger als der Sonant. Die 
soeben schematisch angedeuteten Formen kénnen wir unter Ein- 
schluB des Richtungswechsels als Winkelnormen der Silbenmelodie 
in folgende Regeln zusammenfassen: Steigt die Sonantenmelodie, so ist 
die Melodie des — vorhergehenden oder folgenden — Konsonanten meist weniger 
steigend oder sogar fallend. Fallt die Sonantenmelodie, so ist die Melodie des — 
vorhergehenden oder folgenden — Konsonanten meist weniger fallend oder sogar 
steigend. Falle, wo der Konsonant starker steigt oder starker fallt als 
der vorhergehende oder folgende Sonant, sind deshalb als Anomali- 
tdten zu bezeichnen. — War bei den fallenden Sonanten der Rich- 
tungswechsel oft noch eine Ausnahme, so gelten die Winkelnormen 
auch fiir diese mit verhaltnismabig geringen Einschrankungen. Wie 
die Tabelle III zeigt, machen die Anomalitaten selbst im ungiinstig- 
sten Falle nur etwa ein Drittel aus14. 

Im iubrigen gilt in ahnlicher Weise das, was iiber den Rich- 
tungswechsel festgestellt werden konnte: In der Lautfolge Sonant— 
Konsonant ist die Regel etwas fester als in der Folge Konsonant— 
Sonant: in Bd. 6 bei den Fallwinkeln dagegen wieder weniger fest. 
Bei steigenden Sonanten gilt die Regel strenger als bei fallenden: 
wieder mit der einen Ausnahme der betonten Silben in der Laut- 
folge Konsonant—Sonant in Bd. 6. Bei den unbetonten Silben gibt 


Ma Die verhaltnismaBig wenigen Falle, wo Sonant und Konsonant den gleichen Steig- 
bzw. Fallwinkel haben, sind ausgelassen worden. 
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Tab, II 


Prozentzahlen der Winkelnormen 
Erk]. s. bei Tab. II 


Lautfolge: Lautfolge: 

Sonant-Kons. Kons.-Sonant 
alle { steigend 92 89 
| Silben \ fallend 82 65 
bet. steigend 91 90 
Bd. 3 Silben fallend 69 56 
unbet. steigend 100 83 
Silben fallend 89 69 
Gesamtdurchschnitt 86 76 
alle { steigend 96 71 
Silben \ fallend 68 87 
bet. steigend 96 66 
Bd. 6 Silben fallend 65 95 
| unbet. { steigend 95 94 
Silben | fallend 69 84 
Gesamtdurchschnitt 81 81 


es, entsprechend dem Richtungswechsel, im Durchschnitt noch 
weniger Anomalitaten als bei den betonten: wieder mit Ausnahme 
der Lautfolge Konsonant—Sonant — wenigstens bei den steigenden 
Sonanten — in Bd. 3. Im ganzen gesehen ist also die Tabelle der 
Winkelnormen, wie nicht anders zu erwarten war, ein getreues 
Spiegelbild der Tabelle des Richtungswechsels?>. 

Die Zahl der Anomalitaten verringert sich teilweise noch weiter, 
wenn wir die Falle an Sprechabschnittsenden (ohne « weiterwei- 
senden Sprechtakt»1!®, wo die Stimme eher gehoben als gesenkt 
wird) fortlassen. Von vornherein ist namlich anzunehmen, da an 
solchen Stellen die Melodie eines Endkonsonanten die Tendenz zu 


15 Bethge unterscheidet in seiner oben erwahnten Arbeit (s. Anm. 2) zwischen «kon- 
vexen» ( ( bzw. \ ) und «konkaven» ( / bzw. \ ) Melodieformen der Lautfolge 
Sonant-Konsonant, ohne dabei eine Trennung zwischen Steig- und Fallwinkeln vor- 
zunehmen. Unseren Normen entsprechen demnach die konvexen Steig- und die kon- 
kaven Fallwinkel, wahrend die andern beiden Formen nach unserer Definition anomal 
sind. Die verhaltnismaBig groBen Unterschiede, die B. hinsichtlich konvexer und 
konkaver Form zwischen Bd. 5 und Bd. 6 findet (in Bd. 6 37%, in Bd. 5 nur 20% 
konkav), sind hauptsachlich durch den verschiedenen prozentualen Anteil der fallenden 
und steigenden Winkel, in zweiter Linie wohl besonders durch die verschiedene Prozent- 
zahl der anomalen Falle bei den Fal/winkeln bedingt, die in den beiden von uns ver- 
wendeten Texten auch verschieden ist. Wir erhalten fiir Bd. 6, wie B., 37%, fiir Bd. 3, 
den B. nicht bearbeitet hat, sogar 50%. 

16 Vel. H. Klinghardt. 
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starkem Fallen haben wird, so daB unter Umstanden der Winkel 
steiler als der des vorhergehenden Sonanten werden wird, also 
anomal. Die Untersuchung ergab fiir die fallenden Winkel der 
Lautfolge Sonant-Konsonant an Sprechabschnittsenden in Bd. 3 
tatsaichlich 53% (gegen 18% fur alle Falle). In Bd. 6 betragt die 
Differenz freilich nur wenige Prozent. Hierbei ist aber zu beriick- 
sichtigen, daB die Prozentzahl in dieser Textliste ohnehin schon 
merklich hoher ist als in der anderen, und da ferner Sprech- 
abschnittsenden (ohne weiterweisenden Sprechtakt) in einem Vor- 
lesetext gewohnlich seltener sind als in einer Erzahlung (in unserem 
Falle nur halb so haufig), so da8 die Zahl fiir statistische Unter- 
suchungen etwas zu knapp wird, um giiltige Aussagen zu machen. — 
Fir die Lautfolge Konsonant-Sonant an Sprechabschnittsenden 
betragen die Unterschiede gegen alle Falle in beiden Textlisten nur 
ein paar Prozent. Hier ist ja ein Einflu8 der Stellung im Satz auch 
kaum zu erwarten. 

Im umgekehrten Sinne scheint die Frage und der weiterweisende 
Sprechtakt zu wirken, soweit an solchen Stellen die Stimme merk- 
lich gehoben wird: Folgt auf einen Silbentrager dann noch ein 
stimmhafter Konsonant, so scheint dessen Melodie verhaltnismafig 
oft noch starker zu steigen als die Sonantenmelodie. Genauere 
Zahlen konnen hierfiir jedoch nicht gegeben werden, da zu wenig 
solcher Falle vorliegen. 


Die dreisonorige Silbe 


Die vorstehenden Ausfiihrungen gelten, wie eingangs erwahnt, 
sowohl fiir zweisonorige wie fiir dreisonorige Silben. Es bleibt nur 
noch tibrig, die dreisonorige Silbe als Einheit zu behandeln. Das 
Material ist natiirlich erheblich kleiner. Es stehen uns aber im 
ganzen doch etwa 50 Falle in beiden Texten zur Verfiigung, die als 
Erganzung zu unseren bisherigen Darlegungen ausreichen diirften. 

Aus dem, was in dem vorigen Kapitel tiber Winkelnormen und 
Richtungswechsel fiir die beiden Lautfolgen gesagt wurde, kann 
man auf die Form der dreisonorigen Silbe bereits Schliisse ziehen. 

Die Abbildung 5 gibt eine schematische Ubersicht iiber die 
vorkommenden Melodieformen der Lautfolge Konsonant—-Sonant— 
Konsonant. Die Konsonantenmelodie ist teilweise gestrichelt wie- 
dergegeben. Es sollte damit offengelassen werden, ob die «abgemil- 
derte» oder die «extreme» Form, d.h. Richtungswechsel, sei es bei 


Maack, Regeln der deutschen Silbenmelodie 213 


Steigwinkel 
PEE sit 
yen oa 
Sk me 
N \ 
S as 
FormI Form II Form IIL 
Fallwinkel 
ie ae 
¢? 
‘ Ke 
7 
a7 38 
Ie oo 
Form I Form IT Form I Form IZ 


Abb. 5. Melodieformen der dreisonorigen Silben. 


der Lautfolge Sonant-Konsonant, sei es bei der Folge Konsonant- 
Sonant, vorliege. 

Wie zu erwarten, ist bei den Steigwinkeln die Form I, die den 
Winkelnormen entspricht, in beiden Textlisten die haufigste. Die 
selten vorkommende Form II der Steigwinkel entspricht den Ano- 
malitaten in der Lautfolge Konsonant-Sonant: Hier ist der Winkel 
des Anfangskonsonanten steiler als der des Sonanten. Die auch nicht 
haufige Form III der Steigwinkel entspricht den Anomalitaten in 
der Lautfolge Sonant-Konsonant, mit steilerem HEndkonsonanten. 
AuBerdem gibt es noch einige Falle mit mehrfacher Biegung. Die 


doppelt anomale Form: pie ist bezeichnenderweise weder in 
Bd. 3 noch in Bd. 6 vorhanden. 

Bei den Fallwinkeln ist die den Normen entsprechende Form I 
wieder die Hauptform. Sie kommt aber wegen der bei den Fall- 
winkeln etwas haufigeren Anomalitaten in beiden Textlisten etwas 
seltener vor als die Form I bei den Steigwinkeln. Dic Form II 
entspricht den Anomalitaéten in der Folge Konsonant—Sonant, die 
Form III den Anomalitaten in der Folge Sonant—Konsonant. Beide 
sind erheblich seltener als die Hauptform. Form IV entspricht der 
doppelten Anomalitat. Sie kommt in Bd. 3 mehrmals vor, in Bd. 6 
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nicht. Daneben gibt es noch einige Falle mit mehrfacher Biegung, 
wie bei den Steigwinkeln. 

Uber die Haufigkeit der einzelnen Formen in den beiden Text- 
listen fiir sich und im Durchschnitt beider Textlisten soll die Ta- 
belle IV unterrichten. Wie aus der Tabelle zu ersehen, kommen 
manche Nebenformen nur in einer der beiden Textlisten vor. Bei 
dem etwas knappen Material kann es natiirlich nicht tiberraschen, 
wenn die Abweichungen zwischen den beiden Sprechern diesmal — 
scheinbar — etwas groBer sind. Die Grundtendenz ist aber bei beiden 
offenbar dieselbe. — Dazu ist noch zu bemerken, da die charakte- 


ristischen Formen: ea bew. \_ oft auch in den Fallen gewahrt 


sind, die in der Tabelle IV zu den Nebenformen gezahlt wurden, 
d.h., wo Anomalitéten vorliegen. Zum Beispiel kommt es vor, 
da8 die Melodie des ersten Konsonanten im ganzen starker steigt 
als die des folgenden Sonanten, aber trotzdem mit flachem Einsatz 
beginnt. Entsprechendes gilt fiir die Fallwinkel. 

In meinen beiden ersten Melodiearbeiten (vgl. Anm. 1) hatte 
ich mich mit der Darstellung der Lautmelodiekurven nach dem 
Trendverfahren beschaftigt. Der Trend?’ ist eine — gerade oder 
gekriimmte — Linie, die sich einem gegebenen Kurvenzuge még- 
lichst genau anpa&t, d. h. die mittlere (quadratische) Abweichung 
der einzelnen Punkte des Kurvenzuges von der Linie muB ein 
Minimum werden. Diese Abweichung (im folgenden m, genannt) 
ist also ein MaB fiir die Giite der Annaherung der Trendlinie an den 
Kurvenzug: Je gréBer die Annaherung, um so kleiner ist m,. Der 
Trend 1. Grades ist eine gerade Linie (wie sie zur Bezeichnung des 
Winkels benutzt wurde, den der geradlinig gedachte Melodieverlauf 


Tab. IV 


Prozentuale Haufigkeit der typischen Melodieformen bei dreisonorigen Silben 


Steigwinkel Fallwinkel 
Bd. 3 Bd. 6 D’schn. Bd. 3 Bd. 6 D’schn. 
Form I 53 86 64 Form I 42 bey) 48 
Form II — 14 5 Form II — 18 9 
Form III 20 — 14 Form III 8 18 13 
mehrf.Biegung 27 -- 18 Form IV 25 —_ 13 
mehrf.Biegung 25 9 17 


17 Vegi. P. Lorenz. 
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mit der — waagerechten — Zeitachse bildet), der Trend 2. Grades 
eine einfach gekriimmte, der Trend 3. Grades eine doppelt ge- 
krimmte Kurve usw. — 

Aus der Form der dreisonorigen Silbe miiBte man schlieBen, 
daB der Trend 3. Grades eine sehr gute Angleichung bringt. Die 
mittlere Abweichung des Trends 3. Grades (m,‘* fiir Bd. 3 und 
Bd. 6 ist 0,535 bzw. 0,599. Diese Zahlen sagen nun an sich noch 
gar nichts, wenn man nicht durch Vergleiche einen Mafstab ge- 
winnt. Diese Vergleiche konnen auf verschiedene Weise gewonnen 
werden: Erstens kann man die m,*)-Werte (fiir den Trend 3. Gra- 
des) mit den m,-Werten der Trends niedrigerer Grade in Beziehung 
setzen, m. a. W.: man kann die jeweilige « Besserung» berechnen, 
die ein Trend gegeniiber dem Trend des nachstniedrigeren Grades 
bringt. Es ist auf diese Weise méglich, ziemlich genaue Aussagen 
tiber die vorherrschenden Kurvenformen zu machen. Die «Besse- 

m., (x) 
[eee ‘100 
berechnet worden. Nach dieser Definition ist die « Besserung» also 
das prozentuale Verhaltnis der mittleren Abweichung eines Trends 
zu der mittleren Abweichung des Trends nachstniedrigeren Grades: 
je niedriger die Prozentzahl, um so grofer daher die «Besse- 
rung» 18, 

Die Besserungswerte sind 


in Bd. 3 f. d. Trend 2. Grades gegeniiber d. Trend 1. Grades: 74%, 


rung» ist in der vorliegenden Arbeit nach der Formel 


. O/ 
9 39 3 ele be. 29 a: 9 9 »}) 99 2s 39 ~ ie /09 

. Oo 
bP) bb) 6 EEL eee 29 Ze 29 29 99 29 if 22. 4 14 Yo 

. 0 
29 29 3 cdedwinde? 39 De 29 » bP] 99 Zs 29 : 78 Yo 


Die Zahlen entsprechen vielleicht nicht ganz den Erwartungen, 
weil hiernach doch der Trend 2. Grades, d. h. die eznfach gekriimmte 
Kurve, eine noch bessere Angleichung gegeniiber dem nachst- 
niedrigeren Trend bringt als die doppelt gekriimmte Kurve, die 
wir als charakteristisch fiir die Silbenmelodie herausgestellt hatten. 
Wir miissen hierbei aber bedenken, da die beiden Hauptformen 


18 Jn den friiheren Arbeiten wurde die Besserung berechnet nach der Formel 
m,(*)—m, (*+!) . ¢ 
ama ie 100. Je gréBer die Besserung, um so héher waren also die Prozentwerte. 

m, 
Die jetzige Formel, bei der es umgekehrt ist, kommt i. g. zu ziemlich ahnlichen Ergeb- 
nissen, hat aber den Vorteil, daB sie kiirzer ist und von dem m,(0)-Wert unabhangig 


macht. 
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fiir Steig- und Fallwinkel auch bei der gr6Bten Besserung durch den 
Trend 2. Grades gewahrt bleiben kénnen: Die Prozentzahlen 
driicken dann eben aus, daB die Anfangs- bzw. Endkriimmung oft 
nur verhaltnismafig schwach ist, so daB schon durch eine einfach 
gekriimmte Kurve eine bedeutende Besserung der Angleichung er- 
folgt und die Trends héheren Grades keine groBe Besserung der 
Angleichung mehr bringen kénnen. 

Eine andere Vergleichsméglichkeit bieten die Trends der Ein- 
zellaute!®, die allerdings nur fiir Bd. 6 vorliegen. Es zeigt sich, daB 
die m,'!-Werte der Einzellaute viel niedriger sind als die der 
Silben: 0,778 gegen 1,030. Das bedeutet, daB die Melodie der Ein- 
zellaute erheblich geradliniger verlauft als die der Silben. Ferner 
bringt bei den Einzellauten der Trend 2. Grades eine erheblich 
groBere Besserung als der Trend 3. Grades (64,8 gegen 84,3%). 
Dies bestatigt also das, was schon in den ersten Arbeiten festgestellt 
wurde: dafB bei den Einzellauten in den weitaus meisten Fallen ein 
gerader oder hochstens einfach gekriimmter Melodieverlauf vor- 
liegt, wahrend die Silbenmelodie erst durch den Trend 2. oder 
3. Grades im wesentlichen erfaBt wird. 

Zum Schlu8 noch ein Wort iiber den EinfluB der Quantitat auf 
die Form der Silbenmelodie. Hierzu ist im ganzen folgendes zu 
sagen: Mit zunehmender Silbendauer wird die Abweichung gréBer: 
je hoher der Trendgrad, um so mehr. Die Koeffizienten der Kor- 
relation m,/q?° sind namlich 


fiir den Trend 1. Grades in Bd. 3 = +0,33, in Bd. 6 = +0,29 
be) 9) a9: es ee. bP) 3) e] —— +0,42, bb) 99 6 = +0,40 
bP) bP) 99 3: bP) bP) oNe4 3 = +0,47, 9 99 6 = +0,49 


Mit zunehmender Dauer wird also die Angleichung des Me- 
lodiekurvenzuges an die Trendlinien immer schlechter. Das be- 
deutet, da8B die langeren Silben gréBere Melodieschwankungen, 
also mehrfache Biegungen, aufweisen. Gerade bei diesen mehrfach 


18 Zum Vergleich der Silbenmelodie mit der Lautmelodie sind von den Einzellauten 
die kiirzesten fortzulassen, da sich fiir diese die natiirlichen Vergréberungen der Kurve 
(Festlegung auf */19) sec-Wert) viel starker bemerkbar machen miissen als fiir die langen. 
Man muB bedenken, da z. B. bei 4 gegebenen Punkten schon die véllige Angleichung 
durch den Trend 3. Grades in jedem Falle erfolgt, da 4 Punkte stets durch eine doppelt 
gekriimmte Kurve verbunden werden kénnen. Deshalb sind fiir den Vergleich alle 
kurzen Einzellaute bis zur Dauer von °/19 sec fortgelassen worden: Bei dieser Dauer 
liegen die kiirzesten Silben in Bd. 3 und Bd. 6. 

20 q = Silbendauer in 1/49) sec. 
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gebogenen Melodiekurven spielt es keine groBe Rolle mehr, ob die 
Angleichung durch den Trend 1., 2. oder 3. Grades versucht wird: 
die Abweichung ist bei letzterem nicht mehr viel geringer als bei 
dem Trend 2. oder sogar 1. Grades. Da der Unterschied zwischen 
den einzelnen Trendgraden bei kurzen Silben aber sehr erheblich 
ist, muB die Korrelation m,/q gerade bei den hoheren Trendgraden 
einen besonders hohen positiven Koeffizienten aufweisen. 

Grundsatzlich gilt dasselbe natiirlich auch fiir die Einzellaute, 
die wir noch einmal zum Vergleich heranziehen wollen”. Trotzdem 
sind die Verhaltnisse hier wesentlich andere. Die Koeffizienten der- 
selben Korrelation sind namlich 


fir den Trend 1. Grades = — 0,18 
” y) oy) 2s ” aes ae 0,05 
oy) 29 ” Oe »” = + 0,04. 


Praktisch ist also bei den Trends 2. und 3. Grades gar kein 
EinfluB der Lange festzustellen. DaB der Korrelationskoeffizient fiir 
den 1. Grad leicht negativ ist, m. a. W.: daB die Angleichung an 
die Gerade mit zunehmender Lange besser wird, kommt daher, 
daB die langeren Einzellaute — im Gegensatz zu den langeren 
Silben — einen mehr geraden Melodieverlauf haben. Dies gilt aller- 
dings nicht fiir alle Laute. Gerade bei den Einzellauten sind die 
Unterschiede in dieser Beziehung recht erheblich, worauf ich schon 
friiher hingewiesen habe?*. 

Soviel iiber grundsatzliche Fragen der Silbenmelodie. Die hier 
herausgestellten Regeln gelten natiirlich zunachst nur ftir das Deut- 
sche, wobei es auch noch nicht ganz sicher ist, ob die deutschen 
Mundarten sich einbeziehen lassen. Desgleichen mu} einer spa- 
teren Untersuchung vorbehalten bleiben, ob die oben behandelten 
Regeln auch fiir die Melodie eines gréferen Gefiiges Giiltigkeit 
haben. 


Kusammenfassung 


Anhand von zwei deutschen Schallplattentexten wird das Me- 
lodieverhaltnis der stimmhaften Laute einer Silbe zueinander (d. h. 
des Sonanten als Silbentrager und des unmittelbar vorhergehenden 
oder folgenden stimmhaften Konsonanten) untersucht. Zwischen 


21 Auch hier erst oberhalb 9/49) sec, aus den gleichen Griinden wie oben. 
22 Vel. besonders Arch. vergl. Phon. 2, S. 152 f., 1938. 
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Sonanten- und Konsonantenmelodie bestehen sehr groBe Unter- 
schiede sowohl hinsichtlich der Steilheit als auch hinsichtlich der 
Richtung (steigend-fallend). Die Melodie des Konsonanten hat oft 
die entgegengesetzte Richtung wie die des Sonanten, bei steigender 
Sonantenmelodie sogar tiberwiegend. Haben Sonant und Konso- 
nant die gleiche Melodierichtung, so ist die Melodie des Konso- 
nanten meist flacher als die des Sonanten. Es macht dabei im all- 
gemeinen keinen sehr groBen Unterschied, ob der Konsonant vor 
oder hinter dem Sonanten steht. Silben mit drei stimmhaften Lauten 
(mit dem Sonanten in der Mitte) haben demnach in der Regel eine 
doppelt gekriimmte Melodieform: bei steigender Sonantenmelodie 
S-formig, bei fallender umgekehrt S-formig. Im Gegensatz dazu 
ist die Lautmelodie itiberwiegend geradlinig oder héchstens einfach 
gekriimmt. 


Summary 


An investigation was made, using two German gramophone discs as material, 
into the mutual frequency relations of the voiced sounds of a syllable (i.e. the relations 
between the syllabic sonant and the immediately preceding or following voiced con- 
sonants). Considerable differences were found between the frequency patterns of sonants 
and those of consonants, both in steepness and in direction (rising-falling). The con- 
sonant pattern often has the opposite direction from the sonant, and overwhelmingly 
so when the sonant pattern is rising. If both sonant and consonant have the same fre- 
quency direction, then the consonantal pattern is usually flatter than that of the sonant, 
and in this respect it makes very little difference whether the consonant precedes or 
follows the sonant. As a rule, therefore, syllables with three voiced sounds (with the 
sonant in the middle) have a double change in their frequency pattern, giving an S-like 
shape for patterns with rising sonant and a reversed S when the sonant is falling. The 
patterns of sounds, on the other hand, are predominantly uni-directional or have at the 
most a single change of direction. 


Résumé 


Sur la base de deux textes allemands enregistrés, on examine les rapports réci- 
proques des sons voisés d’une syllabe donnée (c’est-a-dire de la sonante en tant que 
centre de syllabe et de la consonne sonore qui précéde ou qui suit immédiatement). 
Il y a de trés grandes différences entre la mélodie de la sonante et celle de la consonne, 
en ce qui concerne la pente aussi bien que la direction (ascendante—-descendante). La 
mélodie de la consonne a souvent une direction opposée a celle de la sonante et c’est 
ce qui arrive généralement quand la sonante a une mélodie ascendante. Si la direction 
est la méme pour la consonne et la sonante, la mélodie de la consonne est plus plate 
que celle de la sonante. Dans l’ensemble, le fait que la consonne précéde ou suit la 
sonante n’a pas grande importance. Les syllabes formées de trois sons voisés (avec la 
sonante au milieu) ont par conséquent une forme mélodique 4 double courbure: en 
forme de S quand la mélodie de la sonante est ascendante, en forme de S renversé 
quand elle est descendante. Par contre, la mélodie du son isolé est de facon générale 
rectiligne ou tout au plus 4 courbure unique. 
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Zur Frage der Gleichheit von Kau- und 
Sprechbewegungen 


Von EMIL FROESCHELS, New York 


Der Kaumethode (Chewing Approach) liegt die Idee zugrunde, 
daB die Kau- und die Artikulationsbewegungen gleich sein miissen, 
weil sie einander nicht hindern, wenn man wahrend des Kauens 
spricht. Denn man kann nicht gleichzeitig zwei verschiedene Be- 
wegungen mit einer Muskelgruppe ausfiithren. In meinen verschie- 
denen Verdéffentlichungen habe ich absichtlich die Literatur ver- 
nachlassigt, weil in der Literatur wohl einigemal die Vermutung 
geduBert wurde, dab die Artikulationsbewegungen den Kaubewe- 
gungen verwandt sind oder von ihnen aus allmahlich gebildet 
wurden, wahrend ich radikal die Identitat beider behauptete. Eine 
Reihe von Ver6ffentlichungen iiber diese Ansicht und die Verwen- 
dung des lauten Kauens zur Heilung von Stimmstérungen, besonders 
der funktionellen und verschiedener Sprachstérungen, liegt vor?~?°. 
Sie befassen sich hauptsadchlich mit den guten Erfolgen der Kau- 
methode, abgesehen von Weif’ Beitrag zu dem Buche The Chewing 
Approach in Speech Therapy, der «Chewing and the Origin of 
Speech» betitelt ist. Auf diese sechzehn Abhandlungen soll erst 
spater zuriickgekommen werden. Vorerst sollen die Einwendungen 
gegen die Kautheorie, insofern sie die Einheit von Kau- und Sprech- 
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bewegungen betrifft, besprochen werden. Sie erfolgten von drei 
hervorragenden Fachleuten, der zeitlichen Reihenfolge nach von 
Stein", Orthmann® 3 und Trojan". Stein schreibt, daB die Tatigkeit 
der Artikulation weder Atmen noch Kauen ist; man konne nur sagen, 
daB sich diese Tatigkeiten zu Sprechen entwickelt haben und daB 
die hochentwickelte Funktion des Sprechens deshalb gewisse Eigen- 
heiten des Kauens mit sich trage. Orthmanns Ansicht ist, daB «von 
einer Gleichheit der Funktionen nicht gesprochen werden kann, 
...Wahrend kauendes Sprechen den Zahnreihenverschlu8 meidet 
und dadurch einen unbefriedigenden Kaueffekt ergibt, betont das 
sprechende Kauen die Okklusion und behindert den Sprechvorgang 
betrachtlich. Die Aufmerksamkeit schwankt fortwahrend zwischen 
den beiden Funktionen und vermindert im Effekt beide». Darauf 
mochte ich sofort einwenden, daB ich ein derartiges Schwanken an 
mir nicht beobachten konnte, auBer wenn ich meine Aufmerksam- 
keit willkiirlich auf Kauen oder auf Sprechen lenkte, wodurch die 
von mir behauptete Einheitlichkeit eben gest6rt wurde. Gleich- 
lautende Angaben erhielt ich von sehr zahlreichen Personen, die 
wahrend des Kauens sprachen. Aber selbst wenn eine Behinderung 
fiihlbar ist, so glaube ich, daB sie durch den Unterschied begriindet 
ist, ob etwas Festes, wie Nahrung, oder Luft im Munde ist. Trojan}, 
der sich ebenfalls gegen die Einheit der Kau- und Sprechbewegungen 
auBert, betont, daB «das Sprechen von der Notwendigkeit des Kau- 
druckes und der Okklusion des Gebisses entlastet scheint». Ander- 
seits sagt er: «Wahrend nach Wilds subtiler Beschreibung die Zunge 
beim Kauen den Bissen den Zahnen aufladt, ihn immer wieder neu 
formt und zusammenballt, das Vestibulum ausraumt und ihn vor 
und zurick und von einer Seite auf die andere transportiert, ehe es 
nach gentigender Einspeichelung von der Mitte des Gaumen- 
gewolbes zum Schluckakte kommt, sind die Bewegungen beim 
Sprechen weitgehend symmetrisch. » Trojan hat sich in sehr dankens- 
werter Weise der Miihe unterzogen, die beim lauten Kauen auf- 
tretenden Laute auf Band aufzunehmen. Er hat ferner unter Heran- 
ziehung linguistischer Probleme und Theorien versucht, die Kau- 
theorie «etwas zu modifizieren und durch eine Reihe weiterer Ar- 
gumente zu stiitzen, woraus sich u. a. auch ein Gewinn fiir die 
allgemeine Theorie der Silbe ergibt». Zugleich wird eine Synthese 
der Lehre von Froeschels und der R. Fakobsons vom Schichtenbau des 
Sprachlautsystems angestrebt. In derselben Abhandlung weist 
Trojan darauf hin, da sich «im entwicklungsgeschichtlichen Riick- 
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gang die Neigung zu rhythmischem Sprechen verstirkt und sich in 
dieser Hinsicht der Abstand zwischen Kauen und Sprechen ver- 
kiirzt». Mit andern Worten, Trojan, Orthmann und Stein zeigen ihr 
Interesse fiir die Kautheorie, und keiner von ihnen bezweifelt den 
Wert der Kaumethode. Ich muB sogar zugeben, daB Orthmann und 
Trajan sowie die 16 anderen Autoren mehr fiir die Popularisierung 
der Methode und deren Grundlage getan haben als ich selbst. Was 
speziell Trojan und Orthmann betrifft, so hat der erstere mit seiner 
Bandaufnahme und seinen linguistisch-phonetischen Erlauterungen, 
der letztere mit seinem Buche und den darin enthaltenen Kranken- 
geschichten der Kauidee und Kaumethode einen Grad von Beach- 
tung geschenkt, wie er in der medizinischen Literatur irgendeinem 
Heilwege nicht haufig zuteil wird. Schon deswegen, aber natiirlich 
auch aus wissenschaftlicher Verpflichtung, méchte ich versuchen, 
meinen Standpunkt neuerdings und mit zum Teil neuen Beobach- 
tungen und Schluffolgerungen darzulegen. Trojan erwahnt die la- 
teralen Klicks in Negersprachen, die seltenen lateralen L-Laute 
(z. B. das keltische L) und auch die lateralen Sigmatismen. Was die 
lateralen Klicks betrifft, so verdanke ich Herrn Dr. Ernst Westphal, 
Lektor fiir Buschmann- und Hottentottensprachen an der Univer- 
sitat London, briefliche Auskiinfte, von denen ich hier nur die die 
lateralen Klicks betreffende zitiere: «Betreffs Prozentsatz der 
Schnalze zu den der anderen Konsonanten: Es kommt darauf an, 
was man zahlt und wie man es zahlt. Im Worterbuch konnte man 
wohl zwischen 20-60% zahlen, aber es ist ganz verschieden ftr 
verschiedene Sprachen. Ich glaube, da die vierte Sprache, von mir 
in meinem ,Supplement® in Vol. III (African Handbook, Inter- 
national African Institute) vermutet, weniger Schnalze hat als 
Buschmann und Hottentott, aber mehr als Bantu.» Jedenfalls sind 
laterale Klicks keineswegs Ausnahmeerscheinungen. (Sie sind nicht 
so grundverschieden von den in anderen Sprachen gebrauchlichen 
Konsonanten, wie es scheinen mochte, denn Panconcellt-Calcia* hat 
nachgewiesen, daB sie leicht mit einem folgenden Vokal verbunden 
werden kénnen.) 

Begreiflicherweise bin ich selbst durch Sprachstérungen in mei- 
nem Urteil iiber Lateralisation beeinfluBt. Nun ist das seitliche 
Lispeln eine sehr haufige Erscheinung, so daB ich Tausende der- 


* In Gutzmann, H.: Physiologie der Stimme und Sprache; 2. Aufl., Seite 200 
(Braunschweig 1928). 
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artiger Falle sehen konnte. Aber auch laterales L ist nicht selten, 
kann jedoch oft nur durch genaue optische Beobachtung festgestellt 
werden, da es sich akustisch kaum vom medialen unterscheidet, 
auBer wenn es stimmlos gesprochen wird. Ferner sah ich einige hér- 
stumme Kinder, die ihre Zunge oft im Munde «herumwAlzten». 
Als sie wahrend der Behandlung zu sprechen anfingen, artikulierten 
sie die Zungenlaute oft lateral. 

Am meisten aber war ich in meiner Ansicht von der Gleichheit 
der Kau- und der Sprechbewegungen durch die ausnahmslose Er- 
fahrung beeinflu8t, da8 Stimmgestérte, mit der Kaumethode be- 
handelt, keinerlei Schwierigkeiten hatten, von dem urspriinglich 
«sinnlosen» lauten Kauen, bei dem nicht Worter, sondern sinnlose 
Silben zutage kamen, in das laute Kauen der Muttersprache tber- 
zugehen. Mit andern Worten, daf sie die in der Muttersprache ge- 
brauchliche Artikulation ohne Schwierigkeit mit der Stimme des 
primitiven Kauens verbinden konnten. 

Hier muB besonders hervorgehoben werden, dai bei Anwendung 
der Kaumethode der Patient nicht nur nicht aufgefordert wird, die 
beim «sinnlosen» Kauen aufgetauchte Stimme nachzuahmen, son- 
dern da er davor gewarnt wird, irgendeine Stimme zu beabsichtigen. 
Die Stimme, die beim Kauen herauskommt, ist die von uns ge- 
wiinschte. Aber diese Stimme ist — nach unsern genauen Beobachtun- 
gen — dieselbe, die beim «sinnlosen» Kauen erschien! 

Es scheint mir fraglich, ob eine gemeinsame Wurzel von lautem 
Kauen und Sprechen, hatten sich beide Funktionen seit Jahr- 
tausenden voneinander getrennt, sofort wieder aktiv werden kénnte! 
Das andert nichts daran, daB, wie Trojan dargetan hat, kortikale 
und extrapyramidale Bahnen und Zentren an der Sprache (und 
wohl auch am Kauen) beteiligt sind. Ich gebe zu, daB der Grad der 
Beteiligung beim Kauen und beim Sprechen, besonders neu zu er- 
lernender Laute, verschieden ist. Aber beide Systeme sind wohl stets 
beteiligt. 

Ferner mochte ich darauf hinweisen, daB die meisten Menschen, 
wenn aufgefordert, ohne vorausgehende Ubung auf einer Seite des 
Mundes sprechen kénnen (wie es ausnahmsweise geschieht, wenn 
man einem Nachbarn etwas sagt, das andere nicht bemerken sollen). 
Ich erinnere mich, da ich als Kind mit andern Kindern ein solches 
Spiel vollfiithrte. 

Es ist merkwiirdig, da sich die Sprache, von den erwahnten 
Ausnahmen abgesehen, generell nach vorne bewegt und nicht nach 
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der Seite, wo man doch oft zu Leuten spricht, die rechts oder links 
vom Sprecher sitzen oder gehen, vermutlich, weil der Atem auBer- 
halb des Sprechens nach vorne geht. Immerhin kann sich das Spre- 
chen sofort nach einer Seite richten, wenn man es will! 

Ich bin den drei Opponenten dankbar dafiir, daB sie mich ver- 
anlaBt haben, die Kautheorie neuerdings zu iiberpriifen. Endlich 
sei noch H. Beebes'® Probe fiir die Identitat von Kau- und Sprech- 
bewegungen erwahnt: Die Versuchsperson wird angewiesen, ein 
Stiickchen Backwerk im Munde zu halten und irgend etwas zu sagen, 
ohne die Backware zu kauen. Dann wird ihr gezeigt, daB durch das 
Sprechen die Backware zerkaut worden ist. 


Kusammenfassung 


Der Annahme von Sten, Orthmann und Trojan, daB sich die 
Sprechbewegungen aus den Kaubewegungen entwickelt haben, aber 
nicht mit ihnen gleichartig sind, besonders weil Kauen (aber nicht 
ausschlieBlich!) lateral erfolgt, werden folgende Beobachtungen 
entgegengehalten. 1. Negersprachen enthalten zahlreiche laterale 
Klicks, die sich leicht mit Vokalen verbinden. 2. Laterale Sigma- 
tismen sind sehr haufig, laterale L-Laute kommen vor, manche vor- 
her horstumme Kinder sprechen oft anfangs mit lateraler Artikula- 
tion der Zungenlaute. 3. Wahrend der Anwendung der Kaumethode 
zur Heilung von Stimmstérungen besteht niemals eine Schwierigkeit, 
vom «sinnlosen» Kauen zum « Kauen» beim Sprechen der Sprache 
tiberzugehen, obwohl jeder Patient davor gewarnt wird, etwa die 
Stimme, die wahrend des «sinnlosen» Kauens herauskam, nach- 
zuahmen. Er soll einfach wieder beim Sprechen die Stimme heraus- 
kommen lassen, die bei dem Gedanken entsteht, daB er jetzt eben 
auch nichts anderes tut als laut kauen. Die Art der Stimme ist stets 
dieselbe bei «sinnlosem» Kauen und beim Kauen wahrend des 
Gebrauchs der Muttersprache. 4. Die meisten Menschen empfinden 
keinerlei Schwierigkeit, wenn sie der Aufforderung nachkommen, 
durch einen der beiden Mundwinkel zu sprechen, als ob sie jemand, 
der auf einer Seite des Sprechenden steht, ein Geheimnis sagen 
wirden. 

Aus all dem ist der SchluB zu ziehen, da8 Stimme und Mund- 
bewegungen beim Sprechen und lauten Kauen gleichartig sind. 
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Summary 


The following observations are meant to contradict the opinion of Stein, Orthmann 
and Trojan that the speech movements have developed from the chewing movements 
but are not identical, especially because chewing proceeds (although not without 
exception) laterally. 1. Some negro languages contain numerous lateral clicks which can 
easily be connected with vowels. 2. Lateral lisps are very frequent, lateral L sounds exist 
and some originally hearing-mute children sometimes start talking with lateral articu- 
lation of tongue sounds. 3. During the use of the chewing method in the treatment of 
voice troubles there is never any difficulty in proceeding from “nonsense”? chewing to 
chewing meaningful language, although the patient is always warned against imitating 
the voice which was evoked with nonsense chewing. The patient is asked just to let the 
voice come out which develops by the thought that he does not do anything but chew 
aloud. When the method is properly applied the voice is always the same in the mother 
tongue as in the ‘“‘nonsense” chewing. 4. Almost no one encounters any difficulty in 
speaking out of one of either angle of the mouth, as if speaking secretly to a person 
located to the right or left. 

From all these points, the conclusion is made again that the voice and the mouth 
movements in talking and in chewing are identical. 


Résumé 


A Vhypothése de Stein, Orthmann et Trojan suivant laquelle les mouvements de la 
parole se sont développés a partir des mouvements de mastication, mais sans leur étre 
identiques, en particulier parce que la mastication est latérale (quoiqu’elle ne le soit 
pas exclusivement), on peut faire les objections suivantes: 

1° certaines langues africaines contiennent des clics latéraux qui se combinent 
facilement avec les voyelles. 

2° les sigmatismes latéraux sont trés fréquents, il y a beaucoup de L latéraux; 
beaucoup d’enfants sourds commencent a parler avec une articulation latérale des sons 
linguaux. 

3° Dans l’application de la méthode de la mastication au traitement des troubles 
de la parole, on ne rencontre jamais de difficultés pour passer de la simple mastication 
a la mastication avec emploi de la langue, méme si on demande au patient d’essayer 
d’imiter le bruit qu’il faisait pendant la simple mastication. En parlant il doit simplement 
laisser se reproduire ce bruit, croyant qu’il ne fait encore rien d’autre que mastiquer 
tout haut... Le type de bruit produit par simple mastication est identique au bruit 
produit par la mastication avec emploi de la langue maternelle. 

4° La plupart des individus n’éprouvent aucune difficulté, si on les y invite, a 
parler du coin de la bouche, comme s’ils disaient un secret 4 une personne se trouvant 
a leur cété. 

I] faut conclure de tout cela que le «bruit» et les mouvements de la bouche sont 
identiques quand on parle et quand on mastique tout haut. 
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Les indices acoustiques de la parole: 
Premier rapport 


Par PIERRE DELATTRE 


(Fin) 


Les résultats 


Bibliographie: Nous citerons les travaux qui, sauf erreur ou 
omission de notre part, ont contribué a la connaissance des indices 
acoustiques de la parole (serait-ce méme par le stimulant de con- 
clusions erronées) au cours des dix années passées — environ 1947 a 
1957. Les numéros suivent lordre chronologique. 

La premiére question qui se pose en regardant un spectro- 
gramme est: «Quels sont, dans ces 8000 cps de formants, dans cette 
richesse de traits acoustiques, les traits pertinents, du point de vue 
linguistique?» Dés que le premier synthétiseur des laboratoires 
Haskins a été au point, que les tests de parole artificielle résultant de 
la reconversion de spectrogrammes «naturels» ont été satisfaisants, 
le travail de défrichement a visé 4 répondre a cette question. Les 
nombreux formants ont été successivement couverts (un a un, puis 
en groupes) et les résultats de ces omissions ont été soumis a l’identi- 
fication linguistique par Voreille 11.12,18,18, T] est vite ressorti de 
cela qu’en dehors de quelques sons turbulents — surtout les fric- 
tions et explosions de dentales et alvéolaires — les trois formants 
les plus bas, souvent méme les deux formants les plus bas, compre- 
naient tous les principaux traits pertinents. Partis de 1a, on a cherché 
jusqu’a quel point la peinture de spectrogrammes au pinceau per- 
mettait de simplifier Paspect visuel, encore assez complexe, des 
deux ou trois premiers (plus bas) formants du spectre naturel, sans 
perdre l’intelligibilité du son issu de la machine. On a aussi poussé 
la simplification jusqu’a la perte partielle de l’intelligibilité. Ainsi, 
en remplagant successivement les sinuosités de chacun des trois 
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formants pertinents par des lignes droites, on a simulé, pour Voreille, 
Peffet d’un raidissement de machoire (F1), ou l’effet d’un raidisse- 
ment de la langue (F2). En ralentissant la machine, ou inversement 
(ce qui ne change pas la fondamentale), on a fait partiellement 
changer les modes d’articulation: telle consonne sourde devenait 
sonore, telle explosive devenait fricative ou semi-voyelle, telle li- 
quide ou semi-voyelle devenait voyelle ou diphtongue. En variant 
au pinceau la fréquence des ondes turbulentes et la direction des 
transitions de F2 et F3, on a surtout fait changer les lieux d’articu- 
lation. En général, en manipulant tous les aspects imaginables du 
spectrogramme, on a pu isoler des indices acoustiques et percevoir 
les limites dans lesquelles on peut faire varier leurs dimensions pour 
spécifier leurs rdles individuels dans la perception. 


Explosives, ou Occlusives Orales 


En tant que classe de consonnes, les occlusives se distinguent 
surtout par le degré d’interruption du son buccal (tenue), par la 
briéveté du son turbulent intense (explosion) qui suit, et par la 
rapidité des transitions qui ménent a la voyelle suivante ou qui 
viennent de la voyelle précédente. C’est la classe qui a été le plus 
étudiée, probablement parce qu’elle a paru la plus provocante. 
(Les fricatives ont paru si simples a synthétiser qu’on s’en est peu 
soucié au début.) 

Les explosions. La premiére expérience systématique, a l’aide de 
SP, a été organisée pour étudier les effets des explosions d’occlusives 
initiales sourdes1*. Les syllabes a identifier sont composées d’une 
explosion synthétique suivie d’une voyelle synthétique a deux for- 
mants droits de trois harmoniques par formant. Les explosions 
prennent la forme visuelle d’ovales verticaux de 600 cps et 15 ms. 
On leur donne 12 fréquences différentes (de 360 a 4320 cps) qui 
se combinent tour 4 tour avec chacune des 7 voyelles cardinales 
[ie ¢a ou] pour un total de 84 syllabes synthétiques. On a fait 
entendre ces syllabes, enregistrées sur ruban magnétique en ordre 
de hasard, 4 30 sujets non phonéticiens en leur demandant de les 
identifier comme /p/, /t/ ou /k/. Les résultats sont clairs: Les explo- 
sions hautes, en dessus de 3000 cps environ, sont identifiées comme 
/t/, les autres, en dessous de 3000 cps, comme /k/ ou /p/ selon 
qu’elles sont situées juste au dessus du début de F2 (/k/) ou ailleurs 
(/p/). L’examen des résultats révéle aussi que l’effet de la fréquence 
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de l’explosion n’est pas indépendant de la voyelle: dans un cas tout 
spécialement frappant, une méme explosion, d’une fréquence de 
1440 cps, est entendu comme /p/ quand elle est unie a [i] et comme 
/k/ quand elle est unie a [a]. D’autre part des explosions de fré- 
quences extrémement différentes se font entendre comme la méme 
consonne. Donc, d’une part, un méme son peut s’identifier de deux 
maniéres différentes; d’autre part, deux sons fort différents peuvent 
s’identifier de la méme maniére. Deux hypothéses se forment déja, 
qui seront confirmées dans des expériences ultérieures. a) Dans la 
parole, la plus petite unité acoustique est la syllabe. b) S’il existe un 
«invariant» qui permette de distinguer un lieu d’articulation con- 
sonantique d’un autre, il est plutdét dans le geste articulatoire que 
dans le trait acoustique: la forme acoustique de la parole serait 
percue, non directement, mais indirectement par référence au geste 
articulatoire qui est le méme pour plusieurs valeurs acoustiques 
différentes. 

Les explosions ont été étudiées par la synthése dans deux autres 
travaux *!, 52, Les explosions y sont jointes, non a des formants droits 
(voyelles a l’état stable), comme dans l’expérience précédente, mais 
a des formants commengant par des courbes de transition consonne- 
voyelle telles qu’on en voit sur les spectrogrammes. 

Dans *?, on a une vaste étude de toutes les combinaisons appro- 
prices de trois variables: transitions de F2, transitions de F3, et 
explosions. Seule la voyelle américaine [z] est combinée a ces trois 
variables. En ce qui concerne les explosions, nous trouvons 1a 
294 modéles différents (patterns) de syllabes synthétiques identi- 
fiées par 26 sujets comme /b/, /d/, ou /g/: 7 fréquences d’explosion 
jointes a 7 courbes de transition de F2 (7 x 7 =49 syllabes), puis 
jointes aux 35 combinaisons de 5 transitions de F3 avec 7 transitions 
de F2 (35 x 7=245). (Une transition fixe de F1 est toujours pré- 
sente sous une forme qui rend les syllabes sonores.) Ces 294 modéles 
de syllabes avec explosion peuvent se comparer avec les modéles 
sans explosion. Les résultats sont entiérement d’accord avec l’ex- 
périence de? mais vont plus loin: les explosions de haute fréquence 
favorisent les jugements de /d/, celles de basse fréquence, sauf la 
plus basse des 7, les /g/, d’abord (en descendant) aux dépens des /d/, 
puis aux dépens des /b/. Les meilleurs /g/ ont l’explosion juste au 
dessus de la transition (cf. 1°). Enfin la fréquence la plus basse, 
qui ne favorise ni les /d/ ni les /g/, ne favorise que trés peu les /b/. 
De cela il ne faut pas conclure que la perception du lieu d’articu- 
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lation labial dépend seulement des transitions — nous savons qu’en 
absence des transitions, certaines fréquences d’explosion font fort 
bien percevoir le lieu d’articulation labial!® On doit simplement 
conclure que, dans la perception du lieu d’articulation labial, le 
role des explosions est sans doute bien moins important que celui 
des transitions. 

Au total les effets des explosions sont faibles comparés a ceux 
des transitions, pour les trois consonnes, et cela malgré le fait que 
les explosions de ces expériences sont probablement plus concentrées 
en fréquence que dans la parole naturelle. Mais n’oublions pas que 
seule la voyelle [a] a été employée. Avec une voyelle arrondie, le 
role des explosions dans la perception du lieu d’articulation serait 
probablement beaucoup plus fort. 

On trouve quelques données sur les explosions, du point de vue 
du mode d’articulation, dans une étude sur les affriquées*. L’une 
des distinctions entre la classe des affriquées et la classe des explo- 
sives étant dans la durée du son turbulent, il semble que la consonne 
est identifiée comme explosive (et non plus affriquée) a partir d’une 
durée maxima de 30 ms. Cette étude est faite par recollage aussi 
bien que par synthése. 

La premiére expérience importante par recollage !® a voulu vé- 
rifier les résultats de 16 dans la parole naturelle. La vérification a 
été positive. Les bandes magnétiques des syllabes [ki], [ka], [ku], 
ont été coupées juste aprés lexplosion, puis les portions coupées 
ont été recollées a des voyelles [i], [a], [u], sans transitions. Entre 
autres résultats, l’explosion de [ka], jointe a [i], est identifiée 
comme /pi/ par 93 pour cent des sujets, et jointe a [u], comme /pu/ 
par 99 pour cent des sujets. Nous avons donc, de méme que dans 
ee synthétique 1*, une méme explosion entendue comme /k/ 

u /p/ selon qu’elle est unie a [a] ou a [i]. 

On trouve d’autres recollages diexplosives (et autres consonnes) 
dans une étude qui met littéralement a |’épreuve le principe de 
commutation *4, et les résultats sont du méme genre que dans 1}. 
Chaque fois que la voyelle qui suit un élément consonantique fixe 
est changée, la perception de la consonne change aussi. D’ailleurs 
les résultats de toute commutation par recollage sont prévisibles 
d’aprés ce que l’on sait maintenant sur les transitions. 

Dans une analyse détaillée des explosives sourdes et sonores du 
danois23, on trouve toute la complexité des données que fournit 
typiquement l’analyse au sujet des intensités, durées, et diverses 
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concentrations d’énergie sur l’échelle des fréquences, pour les explo- 
sives /p t k b d g/ devant toutes les voyelles danoises. Combien de 
ces traits sont distinctifs? Seule l’épreuve de la reconversion syn- 
thétique en son pourrait le déterminer. (Ainsi le fait que l’explosion 
du /p/ n’est pas concentrée en fréquence mais s’étend sur presque 
toute |’étendue en fréquence du spectre ne veut pas nécessairement 
dire qu’elle n’a pas de réle dans la distinction des lieux d’articula- 
tion. La synthése pourrait montrer que certaines portions — diffé- 
rentes selon les voyelles — de cette haute étendue de bruit en fré- 
quence jouent un tel réle.) En général, les hypothéses, présentées 
dans la conclusion de cette étude, sur le rdle des explosions et transi- 
tions dans la perception des occlusives, ne sont pas d’accord avec 
les résultats ultérieurs obtenus par la synthése 712% 52, Mais notons 
aussi que les «spéculations» de 113, elles non plus, ne sont pas 
d’accord avec les résultats ultérieurs de *1?¢52, A cette époque, 
ni le principe du Locus de F2, ni le réle des transitions de F3 
n’étaient encore connues. 

Deux études, qui comparent les occlusives finales, quand elles 
sont privées de leur détente et quand elles ne le sont pas, arrivent 
a des résultats comparables. Dans l’une*’, omission de la détente 
est simulée par le sujet, qui enregistre sans rouvrir la bouche; dans 
Pautre*®, la syllabe est d’abord enregistrée avec détente, puis la 
détente est coupée. (Le lecteur se rend compte qu’en coupant la 
détente d’une consonne finale, on la prive de lexplosion, ainsi que 
des embryons de transition qui peuvent suivre l’explosion, et qu’il 
ne reste, pour percevoir le lieu d’articulation, que les transitions 
implosives qui précédent la tenue.) Les résultats les plus intéressants 
sont ceux qui montrent, dans les deux études, que les consonnes qui 
souffrent le plus de absence d’explosion sont /k g/ devant [u] 
(devant les voyelles postérieures arrondies, en général). Ce résultat 
indique que la perception du lieu d’articulation de /k g/ devant 
voyelles postérieures arrondies dépend beaucoup de l’explosion et 
peu des transitions. D’ailleurs le fait était 4 prévoir: pour /k g/, la 
transition de F2 devant [0 u] se dirige, non pas vers le Locus vé- 
laire, mais vers le Locus labial; une fois [uk] privé de son explosion, 
c’est [up] ou [u] qui devrait s’entendre — et c’est ce qui arrive dans 
les tests perceptuels de *74°, Dans les tests de °’, c’est, en plus, 
aprés /l/ sombre et /r/ sombre que /k/, privé d’explosion, est mal 
percu; or les formants | et 2 de /I/ et /r/ sombres sont tout proches 
de ceux de [o]. 
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L’étude*® examine encore les explosions par Panalyse et le 
filtrage. On y établit (mais de fagon incertaine) que les explosions 
isolées de leur contexte sont identifiables. Puis, sur la base des 
intensités-fréquences des explosions de /p t k b d g/ aprés et avant 
six voyelles représentatives des diverses positions articulatoires, on 
s’efforce de découvrir, par filtrage, deux paires de traits binaires 
qui permettraient leur identification a l’état isolé. Ces deux paires 
de traits distinctifs passeraient-ils l’épreuve de la synthése? Quoi 
qu’il en soit, on trouve dans cet article des données spectrales pré- 
cieuses sur les explosions, et en gros, ces données sont d’accord avec 
les résultats obtenus par la synthése 1% *?: pour /t d/, les fréquences 
sont hautes; pour /p b/ elles sont basses; et pour /k g/, elles sont 
intermédiaires mais dans une trés grande marge de fréquences parce 
qu’elles suivent les transitions de F2, qui varient d’environ 3000 cps 
a 600 cps. 

Les transitions d’ occlusives. Jusqu’ici, on n’a trouvé d’indices acous- 
tiques que dans les trois premiers formants. Pour abréger, appelons 
leurs transitions Tl, T2, et T3. Les indices trouvés pour T2 et T3 
se rapportent presque entiérement au lieu d’articulation (comme la 
fréquence des explosions). Les indices trouvés pour T1, au contraire, 
se rapportent aux modes d’articulation: distinction entre classes de 
consonnes; distinction entre sourdes et sonores. 

T1: Trés tét, il a été observé, par analyse des spectrogrammes, 
que F1 est d’autant plus haut (fréquence) que les voies buccales 
sont plus ouvertes ®»§. Appliqué aux consonnes, cela indiquerait que 
plus la consonne sonore est ouverte, plus Tl devrait commencer 
haut. Mais aucune investigation systématique de cette corrélation 
n’a été faite pour les consonnes, et il nous faudra réunir des idées 
éparses dans les diverses études. 

Dansalestrecherches:sura 122) *2cet: 1352, pour obtenir des 
occlusives sonores, il a fallu que Tl, assez rapide, commence aussi 
bas que possible (nous ne savons pas si cela correspond effectivement 
4 zéro cps ou a 120 cps — la fondamentale de SP). Dans **, pour 
obtenir des occlusives nasales, on a di faire partir T1, semble-t-il, de 
la fréquence de FN1 (le plus bas formant de tenue nasale — vers 
250 cps) et joindre verticalement le point de départ a la voyelle 
contigué, ce qui fait paraitre, visuellement, que T1 est droit et part 
du niveau méme de la voyelle contigué. Dans l’étude du Locus 
de F1 pour les explosives ?*, les variations de fréquence de F1 droit, 
combinées a F2 courbé, indiquent que le point de départ le plus bas, 
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pour T1, est le meilleur pour les explosives, et que, 4 mesure que ce 
point monte en fréquence, on se rapproche de la perception des 
classes de consonnes plus ouvertes. L’examen des spectrogrammes 
de fricatives indique, en général, pour Tl, un départ moins bas 
que chez les explosives. Quant aux liquides et semi-voyelles ini- 
tiales, on trouve, dans 4°, que leurs T1 doivent partir d’assez haut — 
prés de 400 cps en moyenne — si l’on veut éviter toute perception 
occlusive. 

On voit qwil reste beaucoup a faire pour préciser le rdle de T1 
dans la distinction des classes de consonnes. 

La vitesse de transition et la durée de Tl contribuent aussi a 
des distinctions de classe. Ces deux facteurs, variés a la fois pour T1 
et T2%3, ont permis de distinguer entre les trois classes suivantes: 
voyelles, semi-voyelles, explosives sonores. Par changement de du- 
rée-vitesse de T1-T2, /u/ est passé 4 /w/, puis a /b/; /i/ est passé 
a |j/, puis a /g/; et si Pon avait eu des sujets francais pour faire les 
identifications on aurait sans doute trouvé que, par les variations 
des mémes facteurs, /y/ peut passer a /y/, puis a /d/. Le changement 
de semi-voyelle 4 consonne est plus net que celui de semi-voyelle a 
voyelle. Le changement de /b/ a /w/ se fait quand la transition a 
une durée d’environ 40 ms; celle de /g/ a /j/, 50 a 60 ms. 

La forme zmplosive de T1-T2, et leur forme explosive, sont pré- 
sentées comme contribuant a la perception du point de coupe 
syllabique (respectivement aprés ou avant la consonne) dans *., L’in- 
vestigation est faite par synthése. 

Enfin nous verrons plus loin que certaines dimensions de T1 
semblent contribuer a la distinction entre /p t k/ et /b d g/ commu- 
nément appelée sourde-sonore *?. 

72. Pour une durée assez courte (ou une vitesse assez rapide), 
les T2 sont sans doute les plus puissants indices de distinction entre 
les lieux d’articulation. Excepté chez /k/ devant voyelle arrondie, 
ils sont plus effectifs que les explosions, ce qui est compréhensible, 
car ils ont, comme les formants vocaliques, une beaucoup plus 
grande audibilité que les bruits sourds d’explosion. La durée de T2, 
chez les explosives, est en moyenne de 50 ms, mais elle tend a étre 
plus courte que cela chez les labiales et plus longue chez les dentales 
devant voyelles postérieures. 

Les dimensions de T2 qui contribuent a l’identification du lieu 
@articulation sont a) sa direction, dite positive si elle atteint plus 
haut que F2 de la voyelle, et négative si elle atteint plus bas; 
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b) la différence de fréquence entre son début et le moment ow elle 
rejoint F2 de la voyelle (cette dimension est généralement donnée, 
dans les travaux de Haskins, par un multiple de 120 cps — ainsi 
une transition de —3 atteint une fréquence de 360 cps en dessous du 
formant correspondant de la voyelle. 

Une vaste étude de T2 par la synthése! a suivi de peu I’étude 
6 des explosions. Elle comprenait 11 variations de T2, jointes 
chacune a 7 voyelles cardinales [ie a9 0 ul], et ceci répété pour les 
occlusives sourdes, sonores, et nasales, pour un total de 231 modéles 
de spectrogrammes artificiels, reconvertis en son, et identifiés par 
33 sujets. Aucune explosion n’était employée dans ces modéles. La 
sonorité était obtenue en faisant partir T1 de zéro (ou 120 cps), la 
sourdité en supprimant le début de Tl, et la nasalité en faisant 
partir Tl du niveau de FI et en ajoutant trois formants nasals 
dans la tenue. 

Les résultats, fort complexes, montrent un T2 différent, non 
seulement pour chaque lieu d’articulation, mais pour chaque voyelle 
combinée a chaque lieu d’articulation. Par ailleurs, les résultats 
pour nasales sont fort semblables a ceux des sonores et des sourdes. 

Locus. Dans la recherche d’un invariant par lieu d’articulation, 
on a remarqué que toutes les T2 percgues labiales convergeaient 
virtuellement vers une fréquence basse (quelle que soit la voyelle 
de la syllabe), toutes les T2 percgues dentales (ou alvéolaires) vers 
une fréquence intermédiaire, et toutes les T2 pergues vélaires (ou 
palato-vélaires) vers une fréquence haute. (Cela laissait une petite 
région d’ambignité car devant les voyelles postérieures arrondies 
[o o uj, aucune T2 n’était percue clairement vélaire — probléme 
qui a été résolu depuis.) On a donné le nom de Locus a ce point de 
convergence virtuel des transitions qui ont perceptuellement un 
méme lieu d’articulation. 

La spécification, en fréquence, du Locus a fait lobjet d’une 
longue recherche par la synthése. Le Locus corrélatif 4 chaque lieu 
d’articulation a été déterminé, non par extrapolation de courbes 
de T2, mais par variation de formants droits, évitant ainsi l’erreur 
que pourraient occasionner les courbes: en faisant varier, du haut en 
bas de l’échelle des fréquences un F2 droit (T2 zéro) combiné a 
un T1 fixe, courbé a souhait pour produire une explosive sonore, 
on a obtenu un /g/ quand F2 droit était 4 3000 cps; puis, en abais- 
sant la fréquence de F2 droit, le /g/ s’est perdu et le /d/ a commencé 
A s’entendre pour arriver 4 son maximum de perceptibilité a 
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1800 cps; en continuant a abaisser la fréquence de F2 droit, le /d/ 
s’est perdu et le /b/ s’est fait entendre pour arriver 4 son maximum 
vers 700 cps. Ensuite il a fallu déterminer Ja durée qui sépare 
Vextrémité des T2 de leurs Locus respectifs. Cela s’est fait par des 
coupes successives de transitions partant du Locus méme. On est 
arrivé a la durée moyenne de 50 ms. Le Locus, ainsi spécifié, fournit 
un invariant pratique par lieu d’articulation. Il permet de définir 
une transition d’occlusive sans référence a la voyelle de la syllabe. 
Toute T2 d’occlusive peut se décrire comme ayant une durée d’en- 
viron 50 ms et se dirigeant vers le Locus du lieu d’articulation 
qu’elle fait percevoir par une ligne virtuelle qui l’atteindrait en 
50 ms. Les différences de fréquence entre les extrémités réelles des 
transitions qui sont pergues par un méme lieu d’articulation sont 
évidemment dues a l’anticipation articulatoire de la voyelle contigué 
a la consonne. (La corrélation articulatoire des trois Locus, ainsi 
que la non application du Locus vélaire aux voyelles arrondies, ont 
été clairement établies sur rayons-X cinématographiés, mais nous 
n’avons pas ici la place de traiter les corrélations physiologiques 
des indices acoustiques.) 

Des recherches en cours indiquent que les occlusives vélaires 
devant voyelles arrondies, dans la parole naturelle, ont leur principal 
indice acoustique de lieu d’articulation dans la fréquence de l’ex- 
plosion. Si, dans la parole naturelle, T2 d’une syllabe comme [go] 
ne se dirige pas vers le haut Locus vélaire, c’est a cause de l’arron- 
dissement qui maintient trés basse la fréquence du début de la 
transition. Mais dans la parole artificielle, on peut obtenir un [go] 
sans peindre d’explosion, seulement par des T2 positives, dirigées 
vers le Locus vélaire de 3000 cps et assez longues pour dépasser le 
niveau du Locus dental de 1800 cps. 

Dans ” on trouvera une présentation du concept du Locus tel 
qu’il a été compris personnellement par un visiteur aux laboratoires 
Haskins. Mais disons ici que Phypothése donnant au Locus la fré- 
quence du résonateur buccal avant l’explosion de la consonne n’a 
plus cours. 

Un Analogue électrique des cavités buccales a essayé de vérifier 
le concept du Locus #7. Cet analogue simule trois variables articula- 
toires au moyen desquels il produit synthétiquement des sons sou- 
tenus (genre voyelles) : le point de constriction linguale, le degré de 
constriction linguale, et le degré et la longueur de constriction 
labiale. Il ne produit donc pas de consonnes, mais on peut quand 
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méme utiliser pour I’étude des consonnes en observant sur les 
spectrogrammes successifs les effets de chaque ajustement de va- 
riable. Les résultats ainsi obtenus pour les transitions de /b d g/ sont 
a peu prés d’accord avec les Locus respectifs, 4 condition de com- 
prendre que, tout au cours de l’étude, le terme «Locus» a été 
confondu avec «début de transition». Rien d’extraordinaire a ce 
que les débuts de transition (et non les Locus) varient par anti- 
cipation de la voyelle — anticipation dont on a tenu compte mais 
qu’on a supposée (dans 4?) bien plus marquée qu’elle ne 1’est, 
surtout pour /b/, d’aprés les radiogrammes cinématographiques de 
Particulation de /b d g/. 

Notons, avant de quitter le sujet, que la notion de Locus ne 
s’appliquera pas seulement aux transitions d’occlusives, mais peut- 
étre aux transitions de toutes les consonnes. I] semble bien que les /f/ 
ont le méme Locus que les /p/, les /s/ que les /t/, etc., ou en tout cas 
a peu de chose prés. 

Dans **, nommé déja pour les explosions, les variations de T2 
sont étudiées trés soigneusement, ainsi que leurs combinaisons avec 
des variations de T3, ou d’explosions, ou des deux. Devant la voyelle 
[ez], et Tl fixe étant peint de fagon a produire des occlusives sonores, 
7 variations de T2 sont étudiées: —6, -4, -2, 0, +2, +4, +6. Ce 
sont les mémes dimensions que dans ?! mais avec omission des 
transitions impaires, pour simplifier. Les résultats confirment en- 
tiérement ceux de ?!. Les seules transitions des deux premiers for- 
mants (ni explosions, ni T3) suffisent a distinguer /b d g/ entre eux. 
C’est /b/ qui dépend le plus de T2 et /d/ qui en dépend le moins — 
/d/ dépend de T3 bien plus que les deux autres. Les jugements 
de /b/ sont a peu prés de 100 pour cent a -6, —4, et —2, puis dimi- 
nuent brusquement. A zéro, /d/ atteint presque 90 pc et a +2, 
presque 100 pc, puis /d/ diminue brusquement et fait place a /g/, 
qui atteint 95 pc a +4, et 100 pc a +6. 

Les résultats de l’étude de T2 par l’analyse concordent parfaite- 
ment avec ceux de la synthése, mais naturellement ils sont plus 
vagues — c’est précisément parce que les spectrogrammes sont diffi- 
ciles 4 lire, surtout dans les transitions, que la synthése rend de tels 
services. 

Quatre études de T2 par l’analyse sont a noter. 

Les remarques sur T2 abondent dans ', ou la notion du «hub» 
peut étre considérée comme un avant-poste de celle du Locus, bien 
qu’en réalité les deux notions different considérablement. 
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Les analyses de T2 dans 3, déja mentionnées dans V’introduction, 
prévoyaient avec perspicacité le réle que la synthése allait confirmer 
et préciser. 

On trouve dans 2° de bonnes analyses de T2 dans les explosives 
danoises, qui indiquerait que le Locus des labiales danoises est moins 
bas que celui des labiales anglo-américaines et latines. 

Enfin, les analyses de T2 dans ?* confirment enti¢rement les 
résultats de 1,26 52 obtenus par la synthése. 

T3. Rien n’a encore été publié qui porte spécialement sur T3, 
mais nous pouvons dire que les résultats d’une étude deétaillée, en 
cours de publication, sont d’accord avec ceux de ** que nous ré- 
sumons ci-dessous en notant pourtant qu’ils ne s’appliquent qu’a 
la voyelle [e]. 

Le probléme de T3 est infiniment plus simple que celui de T2 
puisque F3 a a peu prés la méme fréquence pour toutes les voyelles 
(il est un peu plus haut pour un [1] bien cardinal). En gros on peut 
dire que T3 est positive pour les dentales, et négative pour les 
labiales et les vélaires. Parmi les T3 négatives, toutes contribuent 
aux labiales plus qu’aux vélaires, et les moins basses contribuent 
plus aux vélaires que les plus basses. La perception du lieu d’articu- 
lation dental doit beaucoup a T3 (avec certaines voyelles, peut-étre 
plus qu’a T2); celle du lieu d’articulation labial, moins; et celle du 
lieu d’articulation vélaire encore moins (pour les labiales, c’est T2 
qui domine, et pour les vélaires c’est soit T2, soit explosion). 

Dans *, ou d’une part 5 variation de T3 (-4, —2, 0, +2, +4), 
d’autre part 7 fréquences d’explosions, sont combinées a chacune 
des 7 variations de T2, on a l’occasion de comparer les effets de T3 
a ceux des explosions. En général, la contribution de T3 est nette- 
ment plus grande que celle des explosions pour /d/ et /b/; pour /g/, 
c’est inverse: la contribution des explosions est la plus grande. 

D’aprés les remarques analytiques de 2%, les T3 d’occlusives 
danoises différent quelque peu de ce qui précéde. Quant aux ana- 
lyses de 4°, elles sont a peu prés d’accord avec ce qui précéde. (Mais 
on sait les difficultés qu’il y a a distinguer les courbes de T3 sur les 
spectrogrammes. ) 


Les fricatives 


Il a été établi dans * que les fricatives, en tant que classe de 
consonnes, se distinguent en partie des affriquées et des explosives 
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par la durée du bruit (son turbulent) ainsi que par la rapidité avec 
laquelle lintensité initiale de ce bruit croit. La durée du bruit est 
relativement longue, et la vitesse de croissance de l’intensité rela- 
tivement lente, pour les fricatives (voir données aux Affriquées). 
Le réle de la vitesse des transitions dans la distinction de classe n’a 
pas été étudié systématiquement. Il est certain, par exemple, 
qu’entre les transitions rapides de /b/ et les transitions lentes de /w/, 
il existe un régime de transitions qui correspond & /v/, et il faudra 
déterminer 1a les réles respectifs de T1, T2, et T3. Dans cette méme 
distinction des fricatives comme classe, le réle de la fréquence du 
début de Tl mérite aussi d’étre étudié. 

Quant aux indices qui permettent de distinguer entre les di- 
verses fricatives, rien n’ayant paru, nous ne donnerons que de vagues 
indications, hypothétiques, en partie basées sur une communication 
dont Vabstrait est dans FAS. 26: 952. D’aprés la synthése, ces 
indices se trouvent dans les transitions supérieures (T2, T3), et 
dans les bruits de friction. 

Les réles de T2 et T3 dans la perception du lieu d’articulation 
sont sans doute comparables a ceux des occlusives, mais l’étude 
systématique n’en a pas été faite. T2 et [3 devraient donc pouvoir 
se décrire par les Locus corrélatifs aux lieux d’articulation, mais il 
faut s’attendre a ce qu’elles jouent un rdle moins important dans 
les fricatives que dans les occlusives car les bruits de friction sont 
plus audibles que les bruits d’explosion. 

I] faut peut-étre diviser les fricatives en trois sous-classes qui 
se distingueraient entre elles par l’intensité de la friction, l’étendue 
en fréquence de la friction, et les transitions: /s J/ auraient une forte 
intensité et une étendue moyenne; /0 f/ une faible intensité et une 
grande étendue (presque toute la fréquence du spectre sur les spec- 
trogrammes Kay); /¢ X/ une intensité moyenne et une étendue 
étroite. Le réle des transitions ne doit pas étre négligeable car, a 
la synthése, une méme friction (ambigué vers 3500 cps) s’entend 
comme /s/ ou /¢/ selon qu’on la relie a la voyelle par une T3 
(positive — dentale) ou par une T2 (positive — palato-vélaire). 

A Vintérieur de ces trois classes, les distinctions sont simples: 
/s/ se distingue de /{/ principalement par la fréquence de la friction 
(/s/ descend environ jusqu’a 3500 cps, /J/ jusqu’a 2000); /8/ se 
distingue de /f/ principalement par les transitions (ils ont a peu pres, 
/@/ le Locus dental, /f/ le Locus labial) ; /¢/ se distingue de /X/ par 
les deux — fréquence de friction, et transitions. 
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La fricative /h/ serait caractérisée par un bref son turbulent a 
la fréquence de F2 (et peut-étre F3) de la voyelle contigué — donc 
par l’absence de transitions et l’absence de F 1. La glotte étant grande 
ouverte, la friction pertinente pour /h/ serait celle qui résonne dans 
la cavité qui est antérieure au point de constriction vocalique. Ceci, 
contrairement aux voyelles chuchotées, qui résonneraient dans 
toutes les cavités supérieures a la glotte, le point de constriction qui 
produit le son turbulent étant aux cordes vocales mémes — c’est 
pourquoi elles posséderaient un F1, bien que sourdes. 

Un travail par l’analyse et le filtrage est a citer *1.On y étudie 
les spectres de frictions isolées de /f s J/ et des sonores correspon- 
dantes, en toutes positions et prononcées par des sujets variés. Les 
résultats confirment ce qui a été dit plus haut sur la distinction 
entre /s/ et /J/ par la différence de fréquence de la friction. Ils 
apportent un facteur nouveau: /f/ aurait fréquemment — mais pas 
toujours — une concentration d’énergie trés élevée, aux environs de 
8000 cps. Ceci est 4 vérifier par le premier synthétiseur qui atteindra 
cette fréquence. 


Les Affriquées 


Dans l’étude *, déja mentionnée, on examine les affriquées du 
point de vue du mode d’articulation: ce qui les distingue des frica- 
tives et des explosives dans le son turbulent, en dehors du fait que 
les affriquées ont, comme les explosives, une interruption (occlusion 
buccale compléte) que n’ont pas les fricatives. 

On trouve deux indices acoustiques: la durée du bruit, et la 
rapidité de croissance de l’intensité du bruit (mesurée par la durée 
de la période pendant laquelle l’intensité croit, au début du bruit — 
appelons-la: durée de croissance). 

En gros, comparé au bruit des fricatives, le bruit des affriquées 
est (aprés interruption) plus court en durée totale et plus court en 
durée de croissance. Comparé aux explosives, le bruit des affriquées 
est plus long en durée totale. Pour des valeurs moyennes de durée 
de croissance, on pergoit des fricatives sourdes quand le bruit total 
dure au moins 110 ms, des affriquées sourdes quand le bruit total 
dure au moins 50 ms, et des explosives sourdes quand le bruit total 
dure au plus 30 ms. 

Les indices de lieu d’articulation des affriquées n’ont pas été 
étudiés systématiquement, mais il est clair qu’ils se trouveront, 
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comme pour les fricatives et les explosives: d’abord dans les transi- 
tions (Locus) puis dans la fréquence des bruits de friction. II est 
probable que l’intensité du bruit et I’étendue de sa fréquence entre- 
ront en jeu. 


Les Occlusives Nasales 


Nous classons les consonnes nasales /m n n/ parmi les occlu- 
sives parce qu’elles partagent avec les explosives (occlusives orales) 
la forme (vitesse) et la direction des T2 et T3. De plus, la fermeture 
nasale extérieure n’empéche pas leur production; l’ouverture ex- 
térieure des narines, d’ailleurs trés petite, n’est donc pas perti- 
nente — ce qui est pertinent ce sont les occlusions buccales, et la 
communication des cavités nasales avec les cavités buccales par 
Pabaissement du voile du palais. 

Les indices acoustiques de mode d’articulation, aussi bien que 
de lieu, ressortent assez bien de l’étude ?!, faite par la synthése. 

Mode. Les occlusives nasales se distinguent des occlusives orales 
a) par la forme de T1, qui semble partir du niveau de FN1 (environ 
250 cps) et passer verticalement a celui de la voyelle contigué, au 
lieu de partir de zéro ou 120, comme pour les occlusives orales 
sonores; et b) par les formants nasals de la tenue — qui remplacent 
le silence complet des occlusives orales sourdes, ou le ton trés bas 
des occlusives orales sonores (qui correspond a la fondamentale et 
parfois un peu au deuxiéme harmonique entendus a travers les 
parois buccales et pharyngiennes). Dans les expériences de 1, les 
formants de la tenue nasale étaient les mémes pour les trois con- 
sonnes /m n y/, des recherches exploratoires ayant indiqué qu’ils 
ne jouaient qu’un réle trés faible dans la distinction des lieux d’arti- 
culation. Ils étaient aux fréquences de 240 cps, 1020 cps et 2460 cps. 
Les deux plus hauts de ces trois formants nasals étaient d’intensité 
extrémement faible (environ 15 db de moins que ceux d’une voyelle 
normale a la méme fréquence) et contribuaient trés peu a la nasa- 
lité de la consonne. Le premier formant nasal, 4 240 cps, était 
seulement un peu plus faible que celui d’une voyelle normale (en- 
viron 6 db de moins) et avait un puissant effet perceptuel de nasa- 
lisation. Il apparait donc que le mode nasal des consonnes dépend 
de la forme de T1, d’un formant de tenue dans les 250 cps, et des 
formes de T2 et T3 semblables a celles des explosives de inéme lieu 
d’articulation. (L’importance du formant nasal d’environ 250 cps 
a été signalée pour la premiére fois dans *°.) 
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Lieu d’articulation. a) Le réle des transitions, défini par les 
Locus corrélatifs aux lieux d’articulation, est le méme que pour les 
explosives. I] est trés fort mais il n’est pas unique. b) La fréquence 
des formants de tenue nasale supérieurs a celui de 250 cps joue aussi 
un role dans la perception du lieu d’articulation — faible, mais 
certain. Des recherches par synthése, ultérieures a *4, indiquent que 
la perception du lieu d’articulation labial est favorisé par la présence 
dans la tenue d’un F2 faible entre 1000 et 1500 cps, et par absence, 
ou la faiblesse de F3; la perception des lieux d’articulation dentals 
et vélaires, par la présence dans la tenue, d’un F3 aux environs 
de 2300 (en plus de F2). On n’a pas trouvé jusqu’ici d’indice clair 
de distinction entre dentale et vélaire dans les formants de tenue 
nasale. 

On a beaucoup étudié le réle des formants de tenue nasale par 
la technique du recollage. Dans *°, on a inclus, non seulement des 
interversions de tenue nasale avec les transitions qui suivent pour 
les trois consonnes /m n y/, mais encore des interversions de tenue 
nasale avec les transitions qui suivent l’explosion des explosives 
sonores orales /b d g/. Les résultats confirment que Vindice du lieu 
d’articulation est presque entiérement dans les transitions; les tenues 
de nasales ont un role presque négligeable a l’initiale, et un peu plus 
apparent, mais encore trés faible, a la finale. 

On s’est aussi servi de Analogue électrique de la bouche ®° 
pour produire synthétiquement les sons de tenue des trois consonnes 
nasales /m ny/. La distinction des lieux d’articulation a été pergue 
(81 pc, 61 pc, 62 pc respectivement pour /m n y/) — mieux pergue 
que les segments de tenue des nasales humaines de °°: (96 pc, 36 pc, 
12 pc). I faut dire que pour *°, les jugements avaient été faits par 
9 sujets entrainés; pour *® par 50 sujets non entrainés. L’analyse 
spectrale du son de tenue nasale produit par l’Analogue confirme 
Yimportance de F2 pour distinguer /m/ des deux autres, et indique 
une possibilité de distinguer /n/ de /y/ par un formant au dessus 


de 3000 cps. 


Les Liquides et Semi-Voyelles 


Les /w j r 1/ américains ayant certaines similarités spectrales 
de résonance, qui reflétent leur degré d’aperture articulatoire (en 
moyenne plus grand que chez les occlusives, les affriquées et les 
fricatives), on les a étudiés ensemble en position initiale 4°. Le /r/ 
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dont il s’agit ici est une rétroflexe apicale et palatale continue (sans 
battements). 

Mode. Ces quatre consonnes semblent avoir acoustiquement en 
commun, pour se distinguer des autres consonnes: a) Pendant la 
tenue, un I'l de fréquence relativement haute (prés de 400 cps de 
moyenne), qui les distingue surtout des nasales dont le bas formant 
de tenue ne peut pas dépasser 250 cps. b) Pendant la tenue, des 
formants supérieurs 4 F1, d’intensité plus grande que ceux de la 
tenue nasale mais plus faibles que ceux des voyelles. c) Des tran- 
sitions en continuité avec les formants de tenue (les transitions des 
nasales peuvent étre en discontinuité avec les formants de tenue). 
d) Une lenteur relative des transitions (en moyenne environ 100 cps, 
tandis que les transitions d’occlusives ont en moyenne 50 cps). 

Lieu. Ces quatre consonnes se distinguent les unes des autres 
par la fréquence des formants de tenue supérieurs a F1, et les tran- 
sitions allant de la tenue consonantique a la tenue de la voyelle 
contigué. Les transitions peuvent se décrire par un Locus qui serait 
leur point virtuel de convergence corrélatif 4 un méme lieu d’arti- 
culation. a) /w/ se distingue de /r 1/ et de /j/ par le Locus de T2, 
qui est bas pour /w/ (environ 700 cps), moyen pour /r 1/ (environ 
1100 pour /r/ palatal, 1300 pour /1/ alvéolaire) et haut pour /j/ 
(environ 2700). b) /r/ et /l/ se distinguent entre eux par le Locus 
de T3, qui est relativement bas pour /r/ (environ 1500 cps) et haut 
pour /1/ (environ 2500 cps). T3 n’a pas d’effet notable pour /w/ 
et /j/. On peut ajouter trois divergences mineures qui contribuent 
sans doute aussi a la distinction entre ces quatre consonnes: c) Une 
durée de transition de 100 ms est acceptable pour les quatre, mais 
une durée un peu plus courte favorise /l/ contre /r/, et une durée 
un peu plus longue favorise /r/ contre /1/. d) Les formants de tenue 
sont moins indispensables chez les semi-voyelles que chez les li- 
quides; et leur durée moyenne est plus courte chez les semi-voyelles 
(30 ms) que chez les liquides (60 ms). e) /j/ est amélioré par de la 
friction a une fréquence appropriée, ce qui n’est pas le cas des trois 
autres consonnes. Cela rapproche /j/ de la classe des fricatives, classe 
a laquelle il appartient s’il n’est autre que la sonore de /¢/. 


Les Consonnes Syllabiques 


Aucune étude systématique n’a encore paru. Des travaux en 
cours, par la synthése, étudient la réduction d’intensité de F2, et 
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la forme implosive des transitions qui précédent, comme indices de 
modes d’articulation qui distingueront entre les consonnes /l r mn 9j/ 
en position syllabique et les voyelles qui ont leurs formants presque 
aux mémes fréquences: ainsi, [med-l] se distingue de [medo] par 
ces deux indices. 

Les mémes travaux étudient les fréquences de formants comme 
indices acoustiques de distinction entre les diverses consonnes sylla- 
biques. 


Sourdes et Sonores 


A mesure qu’on découvre de nouveaux facteurs acoustiques du 
dit «voisement» ou de la dite «sonorité» des consonnes, la présence 
de la fondamentale (premier harmonique du spectre de la vibration 
des cordes vocales), qui est 4 l’origine de ces termes, prend une plus 
petite place et on arrive prudemment a remplacer les termes «dis- 
tinction sourde-sonore» par «distinction du type p-b!». D’aprés ?°, 
en effet, la distinction /p b/ ne peut pas dépendre de la présence ou 
absence de vibrations des cordes vocales puisqu’elles ne vibrent ni 
pour l’un ni pour l’autre. Nous conserverons cependant, ici, la 
terminologie «sourde-sonore» — arbitrairement, ou dans le sens 
perceptuel. 

a) La marque de sonorité qui est généralement présente sur 
les spectrogrammes pendant la tenue des occlusives sonores est 
appelée dans 1: «barre de voix» (voice bar). Avec filtrage large a 
300 cps, c’est la représentation de la fondamentale, a laquelle il 
s’ajoute une plus ou moins forte intensité du second harmonique, 
selon les sujets. La contribution de cette barre de voix a la percep- 
tion de la sonorité a été amplement confirmé par la synthése: ainsi, 
dans **, afin que les syllabes [ba da ga] soient bien pergues «so- 
nores» on a fait précéder les transitions d’un trait au niveau du 
premier harmonique faisant entendre la fondamentale pendant 
60 ms. Mais on peut, dans la synthése, faire percevoir la sonorité 
par plusieurs autres facteurs, en absence de la fondamentale. On 
peut aussi le faire par recollage: dans 48, quand on remplace la 
tenue du /b/ de «Ruby» (qui contient la fondamentale) par un 
bout vierge de bande magnétique de méme durée, on entend tou- 
jours «Ruby» plutdt que «Rupee» (oreilles anglo-saxonnes et la- 
tines). Pour perdre la sonorité perceptuelle, il ne suffit pas d’omettre 
la fondamentale, il faut, en plus, faire d’autres changements — par 
exemple, allonger le silence de la tenue (voir plus bas a /g/). 
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b) Chez les fricatives — qui gardent une certaine ouverture 
buccale pendant la tenue — le voisement peut comprendre, en plus 
de la barre de voix, une voyelle neutre, de basse intensité, paralle- 
lement 4 la friction. La contribution de ce facteur est confirmée par 
la synthése. 

c) La simple présence de T1 semble contribuer trés fort a la 
perception de la sonorité, et inversement. Dans #1, déja, les occlu- 
sives sourdes étaient produites synthétiquement avec T1 trés réduit. 
Des travaux en cours étudient la suppression de Tl comme facteur 
de surdité en positions initiale, implosive intervocalique ou de dé- 
tente, explosive intervocalique ou de détente. 

d) L’aspiration, c’est-a-dire acoustiquement: l’omission de T1 
et la présence de son turbulent (inharmonique) au lieu de son pé- 
riodique (harmonique) dans les 50 ou 60 premiers ms de T2 et T3, 
contribue nettement a la perception de la surdité. Noter que si T1 
aussi a du son turbulent, il n’y a plus guére d’effet de surdité: sans 
doute parce qu’on a alors dans les 60 premiers ms, non plus de 
Paspiration, mais de la voyelle chuchotée. L’aspiration serait donc 
semblable a la consonne /h/, et, comme /h/, s’articulerait la glotte 
grande ouverte, seules les résonances des cavités antérieures a la 
constriction vocalique étant alors perceptuellement effectives; au 
contraire, la voyelle chuchotée ayant tous les formants de la voyelle 
non chuchotée, y compris F1, sa constriction serait a la glotte, et 
toutes les cavités antérieures a la glotte seraient perceptuellement 
effectives. 

e) La vitesse de transition de Tl a été étudiée dans *, ot une 
durée de T'1 de 20 ms, ou un peu moins fait percevoir les occlusives 
comme sourdes, et une durée de 50 ms ou un peu plus les fait perce- 
voir comme sonores. 

f) La présence de T3 contribue légérement 4 la surdité. Ainsi, 
c’est parce que les modéles spectrographiques artificiels de /b d g/, 
employés pour étudier les variations de T2 dans *!, n’avaient pas 
de T3 qu’il n’a pas été nécessaire d’ajouter une fondamentale; in- 
versement, c’est parce que les modéles employés dans * avaient 
des T3 qu’il a fallu ajouter une fondamentale. 

g) La durée relative de la tenue des consonnes intervocaliques 
(ou finales avec détente vocalique) est un facteur trés puissant. Dans 
48 on a étudié par recollage de parole naturelle, les variations de 
durée de l’interruption buccale (tenue) des explosives: «Ruby» a 
passé 4 «Rupee» entre 60 et 100 ms de tenue, sans fondamentale, 
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et entre 80 et 120 ms de tenue, avec fondamentale. Dans ”’, on peut 
voir, entre autres choses, l’effet de la durée de la friction (tenue des 
fricatives). Ainsi, pour une durée fixe de la voyelle d’une syllabe VG, 
les jugements passent de 100 pc /juz/ a 70 pe /jus/ quand la durée 
de la friction passe de 50 a 250 ms. 

h) L’intensité relative du bruit est aussi un facteur de la surdité. 
Dans 1%, les syllabes synthétiques faites de la combinaison d’une 
explosion et d’une voyelle sans transitions étaient entendues sourdes. 
Dans *2, la présence d’explosions dans des syllabes qu’on voulait 
rendre sonores pour des oreilles américaines a obligé a compenser 
par l’addition d’une fondamentale, suivie d’une lenteur relative de 
T1. Dans 2’, les variations d’intensité du bruit de friction avaient une 
influence sur la perception de la sonorité, mais elle était trés faible. 

i) L’influence de la durée de la voyelle relativement a la durée 
de la friction consonantique suivante est le sujet principal de ?’. 
La technique par synthése permet de combiner plusieurs durées de 
voyelles avec plusieurs durées de frictions, tout en gardant fixes les 
facteurs de transitions. Les résultats sont clairs (mais ils ne s’appli- 
quent qu’aux fricatives): plus la durée relative de la voyelle est 
longue, plus la consonne est percue sonore. Ainsi, pour une certaine 
durée fixe de la friction, les jugements passent de 100 pc /jus/ 
a 65 pe /juz/ quand la voyelle passe de 50 a 200 ms. 

j) Notons enfin que dans une étude ot les consonnes sont identi- 
fiées aprés distortion par filtrage et par addition de bruit 24, les 
distinctions «sourde-sonore» et «orale-nasale» résistent beaucoup 
mieux que les distinctions de lieux d’articulation. 


Les Voyelles Orales 


L’étude systématique des voyelles orales par la synthése a fait 
Pobjet de deux articles: 7:45. Dans 7, on trouve les fréquences de 
formant nécessaires pour synthétiser les 16 principales voyelles car- 
dinales au moyen de deux formants seulement. Ces 16 voyelles ont 
été choisies a l’oreille parmi 235 combinaisons appropriées de va- 
riations de F2 pour F 1 fixe et de F1 pour F2 fixe. Sur le diagramme 
des voyelles qui se forme en portant les fréquences de F1 et F2 en 
abscisse et en ordonnée, il est curieux de remarquer que [z] est en 
ligne avec [i e é], tandis que [a] est en ligne avec [y © ce]. 


Dans }, on établit les faits fondammentaux suivants: 
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a) Dans la synthése, deux formants suffisent 4 bien caractériser 
le timbre des voyelles, méme des voyelles nasales. 

b) Mais les voyelles humaines sont souvent identifiées par trois 
formants. Autrement dit, dans la parole humaine, F3 joue un role 
dans lidentification de certaines voyelles, voire toutes les voyelles 
qui ont un F2 de fréquence assez haute, c’est-a-dire qui ont F2 
et F3 assez rapprochés. Ce sont en général les voyelles antérieures. 

c) Dans la perception, il y a équivalence relative entre deux 
formants rapprochés et un seul formant a une fréquence moyenne 
entre les deux. Ainsi les voyelles postérieures sont identifiables au 
moyen d’un seul formant dont la fréquence est intermédiaire entre 
F] et F2 (F3 est trés faible pour les voyelles postérieures, et ne con- 
tribue guére qu’a leur «naturel», étant aussi trés loin de F2, en 
fréquence). De méme lorsque F2 et F3 sont rapprochés, comme 
dans les voyelles antérieures, la perception de leur somme équivaut 
a peu prés a la perception d’un seul formant dont la fréquence serait 
intermédiaire entre F2 et F3. 

d) Dans les voyelles synthétiques «antérieures» a deux formants, 
la fréquence de F2 est intermédiaire entre les fréquences de F2 
et F3 des voyelles naturelles de méme timbre. Ainsi, le timbre du [i] 
naturel dont les formants sont a 250, 2500 et 3000 cps se synthétise 
bien avec deux formants a 250 et 2750 cps environ. (Mais il va sans 
dire qu’il se synthétise encore mieux avec trois formants aux mémes 
fréquences que la voyelle naturelle!) 

e) Les formants en dessus de 3000 cps pour [i] et en dessus de 
2500 cps pour les autres voyelles n’ont guére de réle dans la carac- 
térisation linguistique des voyelles. Ils contribuent surtout a la 
caractérisation du timbre de la voix individuelle. 

f) Les variations individuelles d’intensité des formants ont deux 
effets différents selon que les formants sont rapprochés ou éloignés 
(en fréquence). Si les deux formants dont on varie les intensités 
relatives sont éloignés l’un de l’autre, 4 mesure que la différence 
d’intensité s’accentue le timbre vocalique devient plus vague, puis 
il perd son identité linguistique pour prendre une identité musicale 
(généralement une dissonance de sons contigus) ; si les deux formants 
sont proches l’un de l’autre (en fréquence), la voyelle change de 
timbre comme si l’effet perceptuel de la somme des deux formants 
devenait de plus en plus semblable 4 |’effet perceptuel du formant 
qui avait gardé son intensité originelle. 

g) Quand F1 seu! diminue d’intensité, le changement de timbre 
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est percu comme allant vers la nasalité. (La premiére indication du 
fait que V’indice acoustique de la nasalité vocalique est dans la 
faible intensité de F1 se trouve donc dans ¥.) 

L’étude *8 des voyelles américaines par filtrage des fréquences 
qui sont supérieures 4 670 cps (dans le but d’omettre tous les for- 
mants en dessus de F1) conclut que les indices acoustiques sont F1, 
F2, et la durée (deux degrés de durée). (Le réle de la durée semble 
en effet indispensable pour distinguer deux voyelles comme /e/ 
et /I/ qui ont presque les mémes fréquences de formants. Notons 
pourtant que le réle de F3 n’a pas été inclus dans cette étude.) 

Les fréquences des formants vocaliques ont été étudiés par 
analyse pour nombre de langues. Par exemple, pour les voyelles 
américaines, dans !)-14 et surtout 1°; pour les voyelles frangaises, 
dans ? et 8; pour les voyelles danoises, dans ?*; pour les voyelles 
suédoises, dans *°; pour les voyelles polonaises, dans 4%; pour les 
voyelles japonaises, dans “4. 

Les analogues électriques décrits dans * 2529 ont produit de 
bonnes voyelles synthétiques, et ont ainsi contribué, non seulement 
a spécifier les corrélations articulatoires et acoustiques, mais a vé- 
rifier la valeur linguistique des résultats obtenus par la synthése. 

Enfin, une théorie proposée dans ® vient d’étre confirmée dans 
47 par la synthése. L’identification linguistique des voyelles ne dé- 
pendrait pas entiérement de la fréquence absolue des formants, mais 
de leur fréquence relativement a la structure totale des formants 
du sujet parlant, structure qui peut légérement varier d’une per- 
sonne a lautre, comme l’indiquent les divergences entre hommes, 
femmes, et enfants (fréquences légérement plus hautes, dans cet 
ordre) établies dans 1°. 


Les Voyelles Nasales 


Les indices de la nasalité vocalique ont été découverts grace a 
la technique de synthése 1° et surtout ?°, et confirmés plus tard par 
un analogue électrique de la bouche *°, et par une analyse des 
voyelles nasales japonaises 41. 

Le premier indice, le seul qui soit capable de transformer une 
voyelle orale en une voyelle nasale, indépendamment des autres 
indices, c’est la réduction d’intensité de Fl. Pour les voyelles na- 
sales frangaises, par synthése, il faut une réduction de 12 a 15 db 
relativement a lintensité normale de F1 dans les voyelles orales. 
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Le second indice (second en importance) est un formant a 
environ 250 cps, que nous appellerons FN1 (premier formant nasal). 
C’est vraisemblablement le formant qui tient la premiére place dans 
la tenue des consonnes nasales. On sait qu’il contribue considérable- 
ment a la nasalité vocalique parce que lorsque FN1 est présent, il 
faut moins de réduction d’intensité de Fl pour que la voyelle soit 
identifiée comme nasale. Mais par lui-méme il ne nasalise que trés 
légérement les voyelles. 

Les autres indices, pas toujours visibles sur les spectrogrammes, 
sont trés faibles et leurs effets perceptuels presque négligeables: ce sont 
principalement un formant vers 1000 cps et un autre vers 2000 cps. 

On attribue hypothétiquement la réduction d’intensité de F1, 
soit au grand amortissement des cavités fibreuses du nez, qui agirait 
seulement sur les ondes de fréquence basse au niveau de F1 *°; 
soit a des antirésonances qui supprimeraient une portion des tons 
de F1*. Les cavités nasales ayant un volume assez fixe, pour que 
ces antirésonances coincident avec les fréquences de F1, il faudrait 
que les cavités buccales, surtout la cavité pharyngienne, fassent une 
accomodation de volume qui accorde les fréquences de F1 4 celles 
des antirésonances. 

L’hypothése de l’amortissement est soutenue par le fait que les 
efforts de l’analogue pour produire des voyelles nasales ont d’abord 
échoué. La simple addition d’une troisiéme cavité, ne faisait que 
produire un formant additionnel vers 1000 cps, et les voyelles n’en 
étaient pas perceptuellement nasalisées. Pour arriver a produire des 
voyelles entendues comme nasales et ayant sur le spectre un F1 de 
trés basse intensité, il a fallu donner un grand amortissement a la 
cavité nasale. 

D’autre part, ’Vhypothése des antirésonances, qui demanderait 
une accomodation des cavités, est soutenu par le fait que le F1 faible 
tend, pour toutes les voyelles nasales, vers une méme fréquence d’en- 
viron 500 cps*1. Cela expliquerait l’évolution de toutes les voyelles 
nasales vers un méme degré d’ouverture (mi-ouvertes): au cours de 
Vhistoire du francais, [in yn un] deviennent [€ ce 5] (approxima- 
tivement) et [4] devient une voyelle qui se rapproche plus de [5] 


que de [4]. 
Prosodte 


Les éléments prosodiques de la parole, tels que accent, le 
rythme, et l’intonation, commencent a étre étudiés par la synthése. 
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On en attend des résultats importants car les facteurs objectifs de 
durée, d’intensité, et de fréquence peuvent étre variés de fagon in- 
dépendante, et les résultats des variations isolées et combinées peu- 
vent se juger subjectivement a l’oreille. 

Une premiére étude a voulu comparer les effets des variations 
de durée et d’intensité (sans inclure, 4 ce point, la fréquence) dans 
la perception de la place de l’accent anglais. On a employé des 
mots tels que «object» qui sont compris comme substantif quand 
accent est sur la premiére syllabe et comme verbe quand il est sur 
la seconde. Quand les sujets identifiaient le mot comme substantif, 
on pouvait admettre qu’ils avaient pergu laccent sur la premiére 
syllabe, et inversement. Résultats: les deux facteurs contribuent a 
la perception de la place de l’accent, mais la durée plus que l’in- 
tensité 78, 

Des études comprenant, de plus, le facteur de la fréquence sont 
en cours. 


Bibliographie Générale 


Notons, pour terminer, les travaux généraux qui ont récapitulé 
et fait des hypothéses se rapportant aux indices acoustiques de la 
parole, entre 1947 et 1957. Dans Vordre chronologique, c’est 
d’abord?, avec une richesse de spectrogrammes de grande valeur, 
bien quils correspondent en général a de la parole ralentie. En- 
suite *, dont la perspicacité a mis sur la voie des recherches actuelles. 
Puis ®, qui a proposé des traits distinctifs 4 caractére binaire en se 
basant en grande partie sur les indices acoustiques qui leur corres- 
pondent. Ce travail «préliminaire» s’étant fié 4 une analyse trop 
hative des spectres, sera entiérement a refaire quand les chercheurs 
acoustiques et physiologiques auront déterminé les vrais indices. 
Dans 1 1% et 18, on peut suivre le développement rapide des 
recherches par la synthése, mais les hypothéses, basées sur des ré- 
sultats partiels, sont en partie fautives, car elles précédent la dé- 
couverte du concept du Locus de F2 et des transitions de F3. Enfin, 
dans ** les spéculations prennent une forme plus avancée. On y 
trouve surtout les vues auxquelles ont mené ces dix années de tra- 
vaux sur les réles respectifs du niveau acoustique et du niveau arti- 
culatoire dans la perception de la parole: en particulier, l’onde 
acoustique ne serait pas percue directement, mais indirectement 
par référence au geste articulatoire. 
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Conclusion 


Bien que les progrés des dix années passées soient impression- 
nants, on est loin de pouvoir encore faire un tableau stir et complet 
des indices acoustiques de la parole. Il reste non seulement a étudier 
a fond nombre de facteurs 4 peine explorés, mais 4 compléter le 
travail pour ceux qui sont les mieux connus en les étudiant mainte- 
nant en toutes positions et devant toutes les voyelles appropriées. 
La recherche portera sur plusieurs indices a la fois dans chacun des 
divers laboratoires mais elle sera quand méme lente: dans |’étude 
complete d’un seul indice, il se passe généralement plusieurs années 
entre le moment ou il est isolé et celui ot les tests définitifs sont 
analysés. Nous ferons un autre rapport dés qu’une avance signifi- 
cative aura été réalisée. 
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Franklin Brook: Stammering and its Treatment. Pitman Medical Publishing Co. Ltd., 
London 1957, 134 p. 21/-. 


It is difficult for a physician to criticize a book on stammering that is devoid of 
any exact symptomology of the speech impediment. Medical science is based upon 
thorough description of symptoms and signs. This is fundamental to all the other means 
by which medicine tries to understand, to treat and to cure any disease. Numerous 
publications on stammering have appeared, especially more recently, which are wanting 
in this respect, among them this one of Franklin Brook. Therefore, only with some restric- 
tions can a review be offered which pays tribute to the work, the enthusiasm and the 
series of recommendations and warnings of the writer. 

In reference to Brook’s quotation of Yohnson’s statement that no stammerer has been 
found among the North American Indians the reviewer consulted an expert on Indian 
language some time ago and received a list of ten Indian words that mean stammering! 
“Stammering is often found to be a symptom of emotional disturbance”, but “the 
emotional background of stammering is very confused’’. True, because stammering will 
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inevitably bring the sufferer into most painful situations — so starting a vicious circle. 
To prove the influence of factors other than psychogenic, one factor which the author 
mentions is that feverish illness causing disturbances of the central nervous system may 
be responsible. Here the discussion between H.Gutzmann and this reviewer about 
stammering as focal symptom should have been taken into consideration. The statement 
that in many cases stammering was present “‘ever since the child started talking”’ is, 
according to the experience of the reviewer, not correct but due to an inexact anamnesis. 
The repetitions of initial syllables in children from 12 to 27 months are not called, as 
Brook believes, ‘‘clonic” but “primary cloni”. The question of a combination of stam- 
mering and dyslalia is dealt with as well as many other important questions. It should 
have been mentioned that a severe dyslalia must be treated together with the stammering 
and that this necessity might produce complications. ‘“Having recognized, for instance, 
that the letter k is a bogy letter, he will proceed to stammer whenever he meets the 
letter.”’ This statement should have been completed by emphatically pointing to the 
fact that stammering never occurs at the end of a word (unless in the one case of van Thal 
who used sometimes a final syllable as a starter for a following word). From this fact 
quite important conclusions can, in the reviewer’s opinion, be drawn concerning the 
“core of stuttering’. Much has been written in this book and others about the difference 
about the older and modern methods of treatment, the first being only a speech therapy, 
the latter a complex one which “demands a lot of hard work spread over a long period 
of at least 12 months’. Innumerable stammerers have been cured by the old methods 
within a fraction of this time! The treatment which Brook uses and recommends includes: 
General relaxation (this, as some other parts of the book, must be read in the original). 
‘When a group of muscles is working at minimum tension and the remaining body 
musculature is relaxed as far as possible, we are in a state of differential relaxation and can 
continue a movement for a long period without strain or fatigue. In practising differential 
relaxation therefore, the stammerer will be seeking the greatest amount of ease in 
speaking.” The term ‘“‘the stammerer”’ is frequently used in this book when, in the 
reviewer’s opinion, ‘‘some stammerers”’ should be used. “‘If the musculature is sufficiently 
relaxed,...there will be a fair degree of clarity loss on all consonants and a slight 
clarity loss on the vowels.”’ Should not the ‘“‘Ventriloquism”’ method have been quoted 
here? On page 68 only a clue is given to the development of signs. A much more exact 
description resulted from many years of work of the former Viennese school. Voluntary 
stammering plays a big part in Brook’s method. An exact knowledge of the so-called 
imitation stammering which differs essentially in its signs from other forms of stammering 
could contribute much to a better understanding of the influence of voluntary stammer- 
ing upon the patient. Voluntary Stammering Techniques is the title of one chapter. 
Also recommended is the Stop Go method consisting of stopping whenever the patient 
feels like stopping. The writer states that group treatment is often helpful. A list of 
suggestions is offered on page 102. Among other very laudable attempts of the writer is 
the one to deal thoroughly with the environment of stammerers, especially home and 
school, and to show how they can help the therapist and in this way the patient. Thorough 
reading of the book is necessary to fully appreciate its merits and its shortcomings. 
Despite the latter, the volume will be a great help to some therapists. Brook points to 
the fact that the choice of treatment used will depend to a great extent on the whole 
personality of the therapist. Scientific findings should certainly influence that choice! 
Therefore, a knowledge of the literature is presupposed! E. Froeschels, New York 


Etudes Tsiganes: Bulletin de I’ Association des Etudes Tsiganes (5, rue Las-Cases, Paris Vile). 


Diese neue Zeitschrift erscheint zwar bereits seit dem 15, April 1955, ist aber auBer- 
halb Frankreichs bisher kaum bekannt geworden. Entgegen dem urspriinglichen Plan 
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sind bis zum Januar 1957 auch nur 8 Hefte herausgekommen. Sie sind von wechselndem 
Umfang und inhaltlich von ungleichem Wert. Offensichtlich fallt es der Vereinigung 
schwer, ihr Periodikum gleichberechtigt gegen das internationalen und traditionellen 
Ruf genieBende «Journal of the Gypsy Lore Society» zu behaupten. Trotz allen noch 
offenbleibenden Wiinschen fiir die redaktionelle Gestaltung ware es jedoch bedauerlich, 
die Etudes Tsiganes etwa wieder verschwinden zu sehen. Beim Mangel an neuer, ernst 
zu nehmender Literatur iiber die Zigeuner — an belletristischen Buchreportagen ist der- 
zeit eine unerwiinschte Hochflut zu verzeichnen — ist jede gehaltvolle Zeitschrift will- 
kommen. Frankreich kénnte durch die Vielzahl seiner Zigeunerstamme bei sorgfaltiger, 
sachgemaBer Forschung Entscheidendes zur Lésung folkloristischer und linguistischer 
Probleme beitragen. Es scheint dem jungen Periodikum aber an philologischen Mit- 
arbeitern zu mangeln. Abgesehen von den summarisch und korrekt informierenden 
« Observations sur la langue tsigane» von P. Meille, die nur dem Laien Neues bringen, 
verdient nur eine Erzahlung des in seinem Kaldera8-Dialekt schreibenden M. Maximoff, 
«E pasledno vudar» (Die letzte Tur), Erwahnung. Es steht zu hoffen, daB sich die 
Vereinigung baldméglichst entscheidet, ob sie ihrem Organ durch gute linguistische 
Originalbeitrage die Lebensfahigkeit und das Interesse der internationalen Zigeuner- 
philologie sichern will. S.A. Wolf, Berlin 


Zdehika Famnické-Smerglovd : Déjiny naSich cikand. Orbis, Praha 1955. 


In der Tschechoslowakei standen die Behérden 1945 vor dem Problem, etwa 
150000 nomadisierende Zigeuner an SeBhaftigkeit und regelmaBige Arbeit zu gewohnen. 
Die Verfasserin nimmt das — in der «Geschichte unserer Zigeuner» — zum AnlaB, die 
traurige Vergangenheit und die gliickliche Gegenwart der Zigeuner gegenitiberzustellen. 
Als roter Faden durchzieht alle Ausfiihrungen die These, da8 nur im Gesellschaftsauf- 
bau volksdemokratischer Staaten die endgiiltige und befriedigende Losung des Zigeuner- 
problems méglich ist. Der gleichen Ansicht ist z.B. auch der riihmlichst bekannte Zigeu- 
nerphilologe und -folklorist Prof. Uhlik in Sarajevo. Aber UAlik ist sicherlich der beste 
Zigeunerkenner Siidosteuropas und wird seine Meinung subjektiv und objektiv vertei- 
digen kénnen, wenn es gewiinscht wird. Die Jamnickd-Smerglovd bringt nichts Eigenes 
auBer einer Fille von Zusammengestoppeltem aus alteren Autoren, Entstellungen und 
Verfalschungen sowie als Tatsachen prasentierten subjektiven Vermutungen. So «weiB» 
sie, daB die Zigeuner, «die Avantgarde des indischen Proletariats», gen Westen wan- 
derten, um sich der «sozialen Unterdriickung» zu entziehen! Diese und ahnliche 
Phrasen hat der ernsthafte Zigeunerforscher Dr. Lipa, der selber durchaus «die wirk- 
liche marxistische Analyse der Tatsachen» bejaht, bereits in der offiziellen «Cesko- 
slovenska ethnografie» als einen «Mi®brauch der marxistischen Terminologie» be- 
zeichnet. 

Die philologische Unkenntnis der Verfasserin iibertrifft womédglich noch ihre 
historischen Mangel. Die klassischen westeuropaischen Zigeunerphilologen tibergeht sie 
mit Schweigen. Da sie jedoch von Sowa und seine bekannte Untersuchung des slowaki- 
schen Zigeunerdialekts nicht ignorieren kann, macht sie ihn aus cinem Deutschen zum 
Polen. Die «walachischen Zigeuner», von denen Gjorgjevié schon 1903 schrieb, daB sie 
nur das Ruminische beherrschten, laBt die Jamnickd-Smerglovd 1955 plétzlich wieder 
die Zigeunersprache sprechen, wenn auch wenigstens «von rumanischen Sprach- 
elementen durchsetzt». Fiir die von ihr konstruierten Gruppen der «schwarzen» und 
«weiBen» Zigeuner hat sie fiir die letztere auch gleich eine angebliche Gaunersprache 
mitgeliefert, deren einzige Grundlage in Unorientiertheit tiber die tschechische Gauner- 
sprache besteht. 

Man muB sich dem tschechischen Urteil anschlieBen, da8 Druck und Erscheinen 
dieses Buches ein «Irrtum» waren. S.A. Wolf, Berlin 
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Bohuslav Hala: Nature acoustique de voyelles. Acta universitatis Carolinae, Prag 1956. 


Die tschechischen Vokale werden wie folgt charakterisiert: 

Zwischen den geschlossenen und den offenen Vokalen nehmen sie eine Zwischen- 
stellung ein. Das tschechische e befindet sich zwischen dem geschlossenen e (fr. été, 
deutsch See, engl. hay) und dem offenen e (fr. téte, deutsch Bar, engl. there). Das o 
ist weder geschlossen wie fr. beau, deutsch Sohn, engl. know noch offen wie fr. bord, 
engl. door. Die langen Laute sind leicht etwas geschlossener als die kurzen. Die tschechi- 
schen a-Laute befinden sich zwischen dem vorderen a (fr. madame, engl. man) und dem 
hinteren (fr. pas, engl. father, deutsch Vater). Das lange a ist um eine Nuance mehr hin- 
ten, das kurze a mehr nach vorn gesprochen. 

Die Spektralanalyse der tschechischen Vokale hat folgendes ergeben: 

1. Die Formantfrequenzen erstrecken sich von 350 bis 2230 Hz (2% Oktaven), 
im Gegensatz zu den franzésischen Vokalen mit 4 Oktaven Umfang. 

2. Die Formanten sowie héhere Frequenzen sind wie folgt verteilt: 


Moke Racienier See. eee pisces 
i 350 680 2230 3155 
u 385 758 2100 2889 
6 530 900 1792 2734 
0 580 982 1617 2610 
4 1175 795 987 1577 2288 
a 1280 750 1022 1776 2369 
e 1660 572 2070 2563 
é 1750 510 2120 2700 
ic 2120 355 2365 2833 
i 2230 326 2610 3400 


u langer Vokal, u kurzer Vokal 


Die Ergebnisse stimmen in groBen Ziigen mit friiheren Messungen anderer Autoren 
uberein, die hier aufgeftihrt wurden. 

Vor Beginn dieser Messung hat der Verfasser 16 altere Methoden der Formant- 
bestimmung tiberpriift: 1. Fliistermethode, 2. Erregung der Mundhoéhle durch Druck- 
luft, 3-6. verschiedene Resonatoren nach Rousselot und Schafer, 7-8. Tonometer nach 
Konig und Schafer, 9. photographische Registrierung, 10-13. verschiedene Registrierung 
mittels Tonfilm, 14. Kathodenstrahl-Oszillograph, 15. Strobilion nach Scripture, 16. 
Geschwindigkeitsanderungen der Schallplattenwiedergabe. 

Die moderneren Methoden der Filter- und Suchtonanalyse wie auch Visible Speech 
wurden nicht beriicksichtigt. Die Betrachtungen tiber die Stabilitat und die Entstehung 
der Formanten stiitzen sich auf die alteren klassischen Anschauungen. Es wird noch 
einmal auf die Auseinandersetzungen Helmholtz—Hermann eingegangen und die bekannte 
Lésung bestatigt, wonach beide Anschauungen durch die Beachtung eines Formant- 
bereichs zu ihrem Recht kommen. F. Winckel, Berlin 
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